- Ang pagkabigo sa pagpapalamig ng AWS ay nagdulot sa Coinbase na mag-enter sa cancel-only mode, na nagdulot ng pagkabigo sa pagtrading, balanse, at pag-access sa account.
- Ibinawi ng Coinbase ang mga serbisyo nang paulit-ulit pagkatapos ilipat ang mga workload mula sa mga apektadong sistema ng AWS infrastructure.
- Nagdulot ng dagdag na presyon ang outage pagkatapos ng mahinang kikitain, na nagpapahikayat sa pagsusuri sa arkitektura ng exchange at pag-handle sa pagkabigo.
Hininto ng Coinbase ang ilang bahagi ng kanyang trading platform noong Mayo 8 pagkatapos magkaron ng pagkabigo sa pagpapalawig ng isang AWS data center, na nagdulot ng pagkabigo sa kritikal na infrastraktura ng exchange. Ayon kay Brian Armstrong, CEO ng Coinbase, maraming chiller na-fail sa loob ng isang AWS facility, na nagresulta sa sobrang init na nakakaapekto sa pag-access sa trading, pagpapakita ng balanse, at pagpapatupad ng order. Ang outage ay nagbunsod sa Coinbase na muling suriin kung paano nila hinarap ang mga pagkabigo sa infrastraktura habang nasa malakas na kondisyon ng merkado ang exchange.
Ang pagkabigo sa AWS ay nagdulot ng pagkakaantala sa mga sistema ng pagtinda ng Coinbase
Ayon kay Brian Armstrong, ang karamihan sa mga sistema ng Coinbase ay nakahandle ng pagkabigo ng AWS Availability Zone ayon sa disenyo. Gayunpaman, ang sentralisadong exchange infrastructure ay hindi nakapagpanatili ng normal na operasyon sa panahon ng insidente.
Nilipat ng Coinbase ang mga merkado sa “Cancel Only” mode sa loob ng ilang oras. Sa panahong iyon, maaari lamang ng mga user na kanselahin ang mga order ngunit hindi makapagsisimula ng mga trade.
Dagdag pa, ayon sa mga customer, may pagkakatigil sa pag-update ng balanse at pansamantalang pagkakawala ng koneksyon. Ang pagkakabigay ay nakaapekto sa Coinbase Exchange, Prime, International, at mga produkto ng derivative.
Sinabi ni Armstrong na ang mga sistema ng exchange ay gumagamit ng arkitektura na nakatuon sa mababang latency at customer co-location. Gayunpaman, ang mga sistema na ito ay kasalukuyang nagsasangkot ng mga kompromiso sa panahon ng malalaking pagkabigo ng infrastruktura.
Sinabi niya na babalik ang Coinbase sa mga kompromisong iyon pagkatapos ng pagkabigo. Tandaan niya rin na gustong mabawasan ng kumpanya ang downtime habang magpapasa sa mga hinaharap na paglipat ng Availability Zone.
Ipinatupad ang Proseso ng Pagbabalik sa Mga Yunit
Samantala, ipinaliwanag ni Rob Witoff, ang pangunahing inhinyero ng Coinbase, kung paano binawi ng kumpanya ang mga serbisyo sa gabi. Ayon kay Witoff, nagsimula ang pagkabigo ng mga panloob na sistema noong hatinggabi ng Mayo 7, na nagresulta sa pagpapatakbo ng mga prosedyur sa emergency.
Nilipat ng Coinbase ang mga workload mula sa naapektuhang AWS infrastructure. Pagkatapos, binawi ng mga inhinyero ang mga sistema ng pagtinda nang paunti-unti, sa halip na buksan lahat nang sabay-sabay.
Una ay pinagana ng exchange ang cancel-only functionality bago lumipat sa auction mode. Pagkatapos, binawi ng Coinbase ang buong pag-trade pagkatapos matapos ang karagdagang pag-check sa produkto.
Kinilala ni Witoff na nawala ang pansamantalang access ng mga customer sa kanilang account at mga pagpapatakbo ng pagtinda. Dagdag niya, ang pagkakaroon ng delay sa mga loob na sistema ng mensahe ay nagdulot din ng pagkakaroon ng pagkakabagabag sa pagpapalit ng balanse.
Pagsisikap sa kita ay nagdaragdag sa mga alalahanin tungkol sa imprastruktura
Kilala, ang pagkakasira ay nangyari kaagad pagkatapos ng Coinbase na ipahayag ang mas mahinang-kaysa-sa-hinayang first-quarter earnings. Kinilala rin ng kumpanya ang mga plano para bawasan ang kanilang puwes ng 14%.
Sa kabila ng mga pag-unlad na iyon, ireport ng Coinbase ang 8.6% na bahagi ng merkado sa pagtrading ng cryptocurrency sa kwarter. Ang kita mula sa retail derivatives ay lumampas din sa $200 milyon taun-taon.
Kinumpirma ng AWS na ang pagkabigo ay nagmula sa pagtaas ng temperatura sa loob ng isang data center sa hilagang Virginia. Sinabi ng kumpanya na itinataas nila ang kapasidad ng pagpapalamig at inire-redirect ang trapiko habang nagpapagawa ng pagpapalit.



