Coinbase 後續分析揭示 AWS 累積故障風險

icon MarsBit
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Coinbase 對 2026 年 5 月 7 日停機事件的事後分析顯示,過度依賴單一可用區的風險,而在 8 小時的中斷期間,恐懼與貪婪指數可能受到影響。AWS 數據中心的冷卻系統故障導致 EC2 和 EBS 停機,迫使進行緊急修復。工程師手動遷移 Kafka 分區以恢復數據流。該公司計劃採用三可用區的 Kafka 架構,並加強災難恢復演練。值得关注的山寨幣可能對此類系統性風險作出反應。

火星財經消息,Coinbase 發布針對 2026 年 5 月 7 日大規模服務中斷事件的復盤報告。此次故障持續約 8 小時,完整恢復耗時約 12 小時,期間交易、充值、提現及多數核心服務均出現不可用或嚴重降級。Coinbase 表示,故障起因是 AWS us-east-1 區域某可用區(use1-az4)數據中心冷卻系統多台製冷機同時失效,引發機櫃熱保護停機,導致 EC2 實例與 EBS 卷下線,並波及多項互聯網服務。在恢復過程中,Coinbase 交易撮合引擎因部署在單一 AWS 機房的叢集架構失去多數節點而喪失 quorum,需緊急通過代碼調整與新節點組重建恢復運行,並在恢復過程中逐步重啟市場交易。此外,AWS 托管 Kafka(MSK)服務出現控制平面故障,導致分區主節點無法自動重新選舉,進一步阻斷報價、手續費及部分結算與數據流系統,擴大了整體影響範圍。Coinbase 與 AWS 工程團隊協作進行手動分區遷移後,系統逐步恢復正常。Coinbase 表示,此次事件暴露出其在跨可用區自動切換能力及託管中間件容災方面的不足。公司將升級跨區域熱備架構、強化定期故障演練,並將 Kafka 系統由雙可用區遷移至三可用區部署,同時與 AWS 共同推進根因修復與改進。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露