- Kegagalan penyejukan AWS memaksa Coinbase masuk ke mod hanya-batal, mengganggu perdagangan, keseimbangan, dan akses akaun.
- Coinbase memulihkan perkhidmatan secara berperingkat selepas memindahkan beban kerja daripada sistem infrastruktur AWS yang terkesan.
- Kegagalan meningkatkan tekanan selepas keuntungan lemah, mendorong tinjauan terhadap arsitektur bursa dan penanganan kegagalan.
Coinbase menghentikan sebahagian platform perdagangannya pada 8 Mei selepas kegagalan penyejukan pusat data AWS mengganggu infrastruktur bursa yang penting. Menurut CEO Coinbase, Brian Armstrong, beberapa penyejuk gagal di dalam fasiliti AWS, menyebabkan pemanasan berlebihan yang memberi kesan terhadap akses perdagangan, paparan baki, dan pelaksanaan pesanan. Kegagalan ini memaksa Coinbase menilai semula bagaimana bursanya menangani kegagalan infrastruktur semasa keadaan pasaran yang volatil.
Kegagalan AWS Mengganggu Sistem Perdagangan Coinbase
Menurut Brian Armstrong, kebanyakan sistem Coinbase menangani gangguan Zon Ketersediaan AWS seperti yang direka. Namun, infrastruktur bursa terpusat gagal mengekalkan operasi normal semasa insiden berlaku.
Coinbase memindahkan pasaran ke mod "Hanya Batal" selama beberapa jam. Semasa tempoh itu, pengguna boleh membatalkan pesanan tetapi tidak boleh membuka perdagangan.
Selain itu, pelanggan melaporkan kemas kini baki yang tertunda dan kegagalan sambungan sementara. Gangguan tersebut mempengaruhi Coinbase Bursa, Prime, Antarabangsa, dan produk derivatif.
Armstrong mengatakan sistem bursa menggunakan arsitektur yang berfokus pada latensi rendah dan kolocation pelanggan. Namun, sistem tersebut saat ini melibatkan kompromi semasa kegagalan infrastruktur besar.
Beliau menyatakan Coinbase akan mengkaji semula tradeoff-tradeoff tersebut selepas kegagalan sistem. Beliau juga mencatat bahawa syarikat ingin mengurangkan masa henti semasa migrasi Zon Ketersediaan masa depan.
Proses Pemulihan Dilaksanakan Secara Bertahap
Sementara itu, ketua kejuruteraan Coinbase, Rob Witoff, menjelaskan bagaimana syarikat memulihkan perkhidmatan semalaman. Menurut Witoff, sistem dalaman bermula gagal pada waktu lewat 7 Mei, mendorong prosedur pemulihan kecemasan.
Coinbase kemudian mengalihkan beban kerja daripada infrastruktur AWS yang terkesan. Selepas itu, jurutera memulihkan sistem perdagangan secara berperingkat, bukannya membuka semuanya serentak.
Bursa pertama kali mengaktifkan fungsi hanya batalkan sebelum berpindah ke mod lelong. Kemudian, Coinbase memulihkan perdagangan penuh setelah menyelesaikan semakan produk tambahan.
Witoff mengakui bahawa pelanggan sementara kehilangan akses kepada akaun dan fungsi perdagangan. Beliau menambah bahawa sistem pesan dalaman yang tertunda juga memperlahankan penyegerakan baki.
Tekanan ke atas keuntungan menambah kebimbangan terhadap infrastruktur
Secara ketara, gangguan itu berlaku tidak lama selepas Coinbase mengumumkan keuntungan kuartal pertama yang lebih lemah daripada jangkaan. Syarikat tersebut juga mengumumkan rancangan untuk mengurangkan tenaga kerjanya sebanyak 14%.
Walaupun perkembangan itu, Coinbase melaporkan pangsa pasaran perdagangan kripto sebanyak 8.6% semasa kuartal tersebut. Hasil derivatif eceran juga melebihi $200 juta setahun.
AWS kemudian mengesahkan bahawa gangguan tersebut berasal dari peningkatan suhu di pusat data di Virginia utara. Syarikat tersebut mengatakan ia meningkatkan kapasiti penyejukan dan mengalihkan lalu lintas semasa usaha pemulihan.



