Ang Coinbase Post-Mortem ay Nagpapakita ng Mga Panganib ng Cascade Failure sa AWS

Ayon sa Mars Finance, inilabas ng Coinbase ang isang post-mortem report tungkol sa malawakang pagkabigo ng serbisyo noong Mayo 7, 2026. Ang pagkabigo ay tumagal ng humigit-kumulang 8 na oras, at ang buong pagbabalik ay nangangailangan ng humigit-kumulang 12 na oras, kung saan ang pagtutustos, pagdeposito, pagwithdraw, at karamihan sa mga pangunahing serbisyo ay hindi magagamit o malubhang nabawasan. Sinabi ng Coinbase na ang sanhi ng pagkabigo ay ang pagkabigo ng maraming air conditioning units sa isang data center sa availability zone (use1-az4) ng AWS us-east-1, na nagresulta sa thermal protection shutdown ng mga cabinet, na nagdulot ng pagbaba ng EC2 instances at EBS volumes, at nag-apekto sa iba’t ibang internet services. Sa proseso ng pagbabalik, nawala ang quorum ng Coinbase trading engine dahil sa kanyang cluster architecture na nakadeploy sa isang AWS data center lamang, kaya kailangan ng pagsasagawa ng code adjustment at pagbuo ng bagong node group upang muling i-activate ito, at ang mga merkado ay muling i-start nang paulit-ulit habang binabawi ang operasyon. Bukod dito, may naganap na control plane failure sa AWS-hosted Kafka (MSK) service, na nagresulta sa hindi kayang awtomatikong mag-re-elect ng partition leaders, na nag-udyok pa sa pagkabigo ng mga quote, fee, at ilang settlement at data flow systems, na lumawak sa kabuuang epekto. Pagkatapos ng collaborative manual partition migration ng Coinbase at AWS engineering teams, unti-unting bumalik ang sistema. Sinabi ng Coinbase na ipinakita ng insidente ang kawalan ng kakayahan nito sa automatic failover sa pagitan ng availability zones at sa disaster recovery ng hosted middleware. Ang kumpanya ay mag-uupgrade sa cross-region hot standby architecture, magpapalakas ng regular na disaster drills, at magpapalipat ng Kafka system mula sa dalawang availability zones patungo sa tatlo, samantala ay magtatrabaho kasama ang AWS upang ayusin ang root cause at gawin ang mga pagpapabuti.