- Hư hỏng hệ thống làm mát của AWS đã buộc Coinbase chuyển sang chế độ chỉ hủy lệnh, gây gián đoạn giao dịch, số dư và truy cập tài khoản.
- Coinbase đã khôi phục dịch vụ từng bước sau khi chuyển tải công việc ra khỏi các hệ thống cơ sở hạ tầng AWS bị ảnh hưởng.
- Sự cố gia tăng áp lực sau báo cáo lợi nhuận yếu, dẫn đến việc xem xét lại kiến trúc sàn giao dịch và cách xử lý sự cố.
Coinbase đã tạm dừng một phần nền tảng giao dịch của mình vào ngày 8 tháng Năm sau khi sự cố làm mát tại trung tâm dữ liệu AWS làm gián đoạn cơ sở hạ tầng quan trọng của sàn giao dịch. Theo CEO Coinbase Brian Armstrong, nhiều thiết bị làm lạnh đã hỏng bên trong cơ sở của AWS, gây ra tình trạng quá nhiệt ảnh hưởng đến khả năng truy cập giao dịch, hiển thị số dư và thực hiện lệnh. Sự cố buộc Coinbase phải đánh giá lại cách sàn giao dịch xử lý các sự cố cơ sở hạ tầng trong điều kiện thị trường biến động.
Sự cố của AWS làm gián đoạn hệ thống giao dịch của Coinbase
Theo Brian Armstrong, hầu hết các hệ thống của Coinbase đã xử lý sự cố khu vực khả dụng của AWS như thiết kế. Tuy nhiên, hạ tầng sàn giao dịch tập trung đã không duy trì hoạt động bình thường trong sự cố.
Coinbase đã chuyển các thị trường sang chế độ “Chỉ hủy” trong vài giờ. Trong khoảng thời gian đó, người dùng có thể hủy lệnh nhưng không thể mở giao dịch.
Ngoài ra, khách hàng báo cáo việc cập nhật số dư bị chậm và các sự cố kết nối tạm thời. Sự cố đã ảnh hưởng đến sàn giao dịch Coinbase, Prime, International và các sản phẩm phái sinh.
Armstrong cho biết các hệ thống sàn giao dịch sử dụng kiến trúc tập trung vào độ trễ thấp và colocasi khách hàng. Tuy nhiên, các hệ thống này hiện tại đòi hỏi sự đánh đổi trong trường hợp xảy ra sự cố hạ tầng lớn.
Anh ấy cho biết Coinbase sẽ xem xét lại những sự đánh đổi đó sau sự cố. Anh ấy cũng lưu ý rằng công ty muốn giảm thời gian ngừng hoạt động trong các lần di chuyển Khu vực Khả dụng trong tương lai.
Quá trình khôi phục được triển khai theo từng giai đoạn
Trong khi đó, trưởng nhóm kỹ thuật của Coinbase, Rob Witoff, đã giải thích cách công ty khôi phục dịch vụ trong đêm. Theo Witoff, các hệ thống nội bộ bắt đầu gặp sự cố vào cuối ngày 7 tháng 5, dẫn đến việc triển khai các thủ tục khôi phục khẩn cấp.
Coinbase sau đó đã chuyển tải công việc ra khỏi cơ sở hạ tầng AWS bị ảnh hưởng. Sau đó, các kỹ sư đã khôi phục các hệ thống giao dịch từng bước thay vì mở lại tất cả cùng một lúc.
Sàn giao dịch lần đầu tiên kích hoạt chức năng chỉ hủy lệnh trước khi chuyển sang chế độ đấu giá. Sau đó, Coinbase khôi phục giao dịch đầy đủ sau khi hoàn thành các kiểm tra sản phẩm bổ sung.
Witoff thừa nhận khách hàng tạm thời mất quyền truy cập vào tài khoản và các chức năng giao dịch. Ông bổ sung rằng các hệ thống nhắn tin nội bộ bị chậm cũng làm chậm quá trình đồng bộ hóa số dư.
Áp lực lợi nhuận làm gia tăng mối quan tâm về cơ sở hạ tầng
Đáng chú ý, sự cố xảy ra ngay sau khi Coinbase công bố kết quả kinh doanh quý đầu tiên yếu hơn dự kiến first-quarter earnings. Công ty cũng thông báo kế hoạch cắt giảm 14% lực lượng lao động.
Mặc dù có những phát triển đó, Coinbase báo cáo thị phần giao dịch tiền điện tử là 8,6% trong quý. Doanh thu phái sinh của khách hàng lẻ cũng vượt quá 200 triệu USD mỗi năm.
AWS sau đó xác nhận sự gián đoạn bắt nguồn từ nhiệt độ tăng cao trong một trung tâm dữ liệu ở miền Bắc Virginia. Công ty cho biết đã tăng công suất làm mát và chuyển hướng lưu lượng truy cập trong quá trình khắc phục.



