- ความล้มเหลวของระบบระบายความร้อนของ AWS บังคับให้ Coinbase เข้าสู่โหมดยกเลิกเท่านั้น ทำให้การซื้อขาย ยอดเงิน และการเข้าถึงบัญชีหยุดชะงัก
- Coinbase ได้ฟื้นบริการอย่างค่อยเป็นค่อยไปหลังจากย้ายภาระงานออกจากระบบโครงสร้างพื้นฐาน AWS ที่ได้รับผลกระทบ
- การหยุดทำงานเพิ่มแรงกดดันหลังจากผลกำไรที่อ่อนแอ ทำให้ต้องทบทวนสถาปัตยกรรมของแพลตฟอร์มแลกเปลี่ยนและการจัดการความล้มเหลว
Coinbase ระงับส่วนหนึ่งของแพลตฟอร์มการซื้อขายเมื่อวันที่ 8 พฤษภาคม หลังจากความล้มเหลวของระบบระบายความร้อนในศูนย์ข้อมูลของ AWS ทำให้โครงสร้างพื้นฐานหลักของแพลตฟอร์มแลกเปลี่ยนล่ม ตามคำกล่าวของซีอีโอของ Coinbase ไบรอัน อาร์มสตรอง ชิลเลอร์หลายตัว ล้มเหลว ภายในสถานที่ของ AWS ทำให้เกิดความร้อนสูงเกินไป ส่งผลกระทบต่อการเข้าถึงการซื้อขาย การแสดงยอดเงิน และการดำเนินการคำสั่ง การหยุดชะงักครั้งนี้บังคับให้ Coinbase ทบทวนวิธีการจัดการกับความล้มเหลวของโครงสร้างพื้นฐานในช่วงสภาวะตลาดผันผวน
ความล้มเหลวของ AWS รบกวนระบบการซื้อขายของ Coinbase
ตามที่ไบรอัน อาร์มสตรอง กล่าว ระบบส่วนใหญ่ของ Coinbase จัดการกับการหยุดชะงักของโซนความพร้อมใช้งานของ AWS ตามที่ออกแบบไว้ อย่างไรก็ตาม โครงสร้างพื้นฐานของแพลตฟอร์มแลกเปลี่ยนแบบกลางศูนย์ล้มเหลวในการรักษาการดำเนินงานตามปกติในระหว่างเหตุการณ์
Coinbase ย้ายตลาดเข้าสู่โหมด “ยกเลิกเท่านั้น” เป็นเวลาหลายชั่วโมง ในช่วงเวลานั้น ผู้ใช้สามารถยกเลิกคำสั่งได้ แต่ไม่สามารถเปิดการซื้อขายใหม่ได้
นอกจากนี้ ลูกค้ารายงานว่ามีการอัปเดตยอดเงินล่าช้าและการเชื่อมต่อล้มเหลวชั่วคราว การขัดข้องส่งผลกระทบต่อ Coinbase Exchange, Prime, International และผลิตภัณฑ์อนุพันธ์
อาร์มสตรองกล่าวว่าระบบแพลตฟอร์มแลกเปลี่ยนใช้สถาปัตยกรรมที่เน้นความล่าช้าต่ำและการตั้งอยู่ร่วมกับลูกค้า อย่างไรก็ตาม ระบบที่เหล่านี้ในปัจจุบันต้องแลกเปลี่ยนข้อดีข้อเสียในช่วงที่เกิดความล้มเหลวของโครงสร้างพื้นฐานขนาดใหญ่
เขาระบุว่า Coinbase จะทบทวนข้อประนีประนอมเหล่านั้นหลังจากเกิดการหยุดให้บริการ เขายังระบุว่าบริษัทต้องการลดช่วงเวลาที่ไม่สามารถให้บริการได้ระหว่างการย้ายไปยังโซนความพร้อมใช้งานในอนาคต
กระบวนการกู้คืนถูกดำเนินการเป็นขั้นตอน
ในขณะเดียวกัน หัวหน้าทีมวิศวกรรมของ Coinbase โรบ วิทอฟฟ์ อธิบายว่าบริษัทฟื้นบริการต่างๆ ระหว่างคืนอย่างไร ตามคำอธิบายของวิทอฟฟ์ ระบบภายในเริ่มล้มเหลวเมื่อช่วงดึกวันที่ 7 พฤษภาคม ทำให้ต้องดำเนินการกู้คืนฉุกเฉิน
Coinbase จึงย้ายภาระงานออกจากโครงสร้างพื้นฐาน AWS ที่ได้รับผลกระทบ จากนั้นวิศวกรจึงค่อยๆ กู้คืนระบบการซื้อขายแทนการเปิดทุกอย่างพร้อมกัน
แพลตฟอร์มแลกเปลี่ยนเปิดใช้งานฟังก์ชันยกเลิกเท่านั้นก่อนที่จะเข้าสู่โหมดการประมูล ต่อมา Coinbase ได้กู้คืนการซื้อขายแบบเต็มรูปแบบหลังจากเสร็จสิ้นการตรวจสอบผลิตภัณฑ์เพิ่มเติม
วิทอฟฟ์ยอมรับว่าลูกค้าสูญเสียการเข้าถึงบัญชีและฟังก์ชันการซื้อขายชั่วคราว เขาเพิ่มเติมว่าระบบข้อความภายในที่ล่าช้ายังทำให้การซิงโครไนซ์ยอดเงินช้าลง
แรงกดดันด้านกำไรเพิ่มความกังวลเกี่ยวกับโครงสร้างพื้นฐาน
ที่สังเกตได้ชัดเจนคือ การหยุดให้บริการเกิดขึ้นไม่นานหลังจาก Coinbase เปิดเผยผลกำไรไตรมาสแรกที่อ่อนแอกว่าที่คาดไว้ first-quarter earnings บริษัทยังประกาศแผนลดกำลังคนลง 14%
แม้จะมีการพัฒนาเหล่านั้น Coinbase รายงานส่วนแบ่งตลาดการซื้อขายสกุลเงินดิจิทัลที่ 8.6% ในไตรมาสนี้ รายได้จากอนุพันธ์ของผู้ใช้รายย่อยยังเกิน 200 ล้านดอลลาร์สหรัฐต่อปี
AWS ยืนยันต่อมาว่า การหยุดชะงักเกิดจากอุณหภูมิที่สูงขึ้นภายในศูนย์ข้อมูลในรัฐเวอร์จิเนียตอนเหนือ บริษัทระบุว่าได้เพิ่มความสามารถในการระบายความร้อนและเปลี่ยนเส้นทางการจราจรระหว่างการฟื้นฟู



