BlockBeatsの情報によると、5月9日、CoinbaseのCEOであるBrian Armstrongは、昨日Coinbaseがサービス停止を経験したことは決して許容できないと述べました。根本的な原因は、AWSデータセンターの1つのラックが過熱し、複数の冷却装置が故障したことです。当社のサービスは、単一のAWS可用性ゾーン(AZ)の障害に対して冗長性を備えるように設計されています。昨夜、大多数のシステムはその通りに動作しましたが、すべてがそうではありませんでした。中央集権型取引所は、遅延と顧客ホスティングの最適化を優先した結果、冗長性を実現できませんでした。取引所を可用性ゾーンの障害から守ることは可能ですが、それは遅延を引き起こし、顧客ホスティングの効果を損ないます。
このイベントを受けて、Coinbaseは、可用性ゾーンの移行が必要な場合にダウンタイムを大幅に短縮できるよう、再評価と調整を行います。AWSおよびCoinbaseのチームが夜を徹して問題の対応を行ったことに感謝します。その後、詳細な技術的まとめを共有する予定です。


