Coinbase проводит анализ своей инфраструктуры биржи после сбоя охлаждения в дата-центре AWS, который вывел из строя несколько торговых сервисов, заблокировал доступ к некоторым аккаунтам и задержал отображение балансов клиентов. Генеральный директор Брайан Армстронг назвал этот сбой «неприемлемым» и заявил, что Coinbase пересмотрит компромиссы, связанные со скоростью, совместным размещением и более быстрым восстановлением при сбоях инфраструктуры.
Основные выводы:
- Генеральный директор Coinbase Брайан Армстронг назвал сбой в работе биржи, связанный с AWS, неприемлемым для клиентов.
- Торговля, доступ к аккаунту и информация о клиентских аккаунтах были нарушены на нескольких сервисах биржи Coinbase.
- Coinbase планирует пересмотреть компромиссы в устойчивости, чтобы сократить продолжительность будущих простоев и влияние на клиентов.
Армстронг говорит, что компромиссы в устойчивости будут пересмотрены
Crypto биржа Coinbase (Nasdaq: COIN) объяснила, как сбой в системе охлаждения центра обработки данных AWS вызвал сбой сервиса, нарушив торговлю, доступ к бирже и данные аккаунтов клиентов на платформе. Генеральный директор Coinbase Брайан Армстронг прокомментировал инцидент на X, а ведущий инженер Роб Витофф подробно описал процесс восстановления и влияние на клиентов.
«Вчера вечером у Coinbase произошел сбой, что недопустимо», — написал Армстронг 8 мая. Он добавил, что большинство систем Coinbase были разработаны для устойчивости к простоям в одной зоне доступности AWS, но централизованная биржа во время сбоя не сработала так. «Возможно сделать биржи устойчивыми к сбоям в зонах доступности, но это может вызвать задержки по времени, которые нежелательны, а также нарушить ко-локацию клиентов», — заявил Армстронг и добавил:
Учитывая этот инцидент, мы пересмотрим эти компромиссы, чтобы обеспечить вам наилучшую площадку для торговли. По крайней мере, продолжительность простоя должна быть значительно сокращена при необходимости перемещения AZ.
Армстронг отметил, что Coinbase проведет анализ того, как она балансирует скорость биржи, ко-локацию клиентов и время восстановления после сбоев инфраструктуры. Его комментарии были сосредоточены на снижении влияния и продолжительности будущих простоев, влияющих на доступ клиентов и торговую активность.
Как Coinbase восстановила торговлю и обновления балансов
Руководитель инженерной команды Coinbase Роб Витофф опубликовал в X, что сбой начался поздно 7 мая, когда начали отказывать внутренние системы, и команды экстренного реагирования начали расследование. Отказ затронул спотовую торговлю, Prime, международные и деривативные биржи. Клиенты также столкнулись с проблемами при доступе к сервисам биржи, совершении сделок и просмотре балансов аккаунтов.
Витофф объяснил, что торговля была приостановлена после того, как системы биржи не смогли продолжать работу безопасно во время сбоя инфраструктуры. Он также отметил, что внутренние системы обмена сообщениями замедлились, из-за чего некоторые данные аккаунтов отставали, пока процесс восстановления не догнал их. Он признал:
Потеря доступа к вашему аккаунту, даже временная, неприемлема.
Восстановление осуществлялось поэтапно, а не сразу. Coinbase переместил затронутые рабочие нагрузки из проблемной зоны, восстановил системы, необходимые для обработки сделок, и позволил отложенным данным клиентов догнать текущий уровень. Рынки возобновили работу осторожно: сначала в режиме только отмены, затем进行了 продукт-проверки, режим аукциона, и в конце — восстановлена торговля на бирже Coinbase.
