Mensaje de BlockBeats, 9 de mayo: Brian Armstrong, CEO de Coinbase, indicó que ayer Coinbase sufrió una interrupción, lo cual es absolutamente inaceptable. La causa fundamental fue que una sala de un centro de datos de AWS se sobrecalentó, provocando el fallo de múltiples sistemas de refrigeración. Diseñamos nuestros servicios para tener redundancia frente a cualquier interrupción individual en una zona de disponibilidad (AZ) de AWS; anoche, la mayoría de nuestros sistemas funcionaron como se esperaba, pero no todos. Las plataformas centralizadas de intercambio no lograron redundancia debido a su optimización para latencia y alojamiento de clientes. Aunque es posible hacer que las plataformas de intercambio resistan fallos de zona, esto introduciría latencia y comprometería el alojamiento de clientes.
En vista de este evento, Coinbase reevaluará y equilibrará los tiempos de inactividad, que deberían reducirse significativamente al menos cuando sea necesario migrar zonas de disponibilidad. Agradecemos al equipo de AWS y Coinbase por haber mitigado el problema durante la noche y compartiremos un resumen técnico detallado posteriormente.


