- การหยุดทำงานสองครั้งเกิดจากบั๊กการชาร์จแก๊สที่ทำให้ตัวตรวจสอบล้มเหลวเมื่อธุรกรรมที่ล้มเหลวกระตุ้นข้อผิดพลาดของยอดเงิน
- ข้อผิดพลาดด้านสถานะความสุ่มที่แยกต่างหากทำให้เกิดการหยุดทำงานครั้งที่สาม โดยป้องกันไม่ให้ตัวตรวจสอบปิดช่วงเวลาของเครือข่ายอย่างถูกต้อง
- Sui ระบุว่าไม่มีเงินของผู้ใช้ได้รับผลกระทบ ได้ดำเนินการแก้ไขและเพิ่มมาตรการป้องกันเพื่อปรับปรุงความทนทานของเครือข่าย
Sui Foundation เมื่อวันอาทิตย์ อธิบาย สาเหตุของการหยุดทำงานของ Mainnet สามครั้ง ซึ่งรบกวนการดำเนินงานของเครือข่ายในช่วงวันพฤหัสบดีและวันศุกร์ โดยระบุว่าเหตุการณ์เหล่านี้เกิดจากข้อผิดพลาดสองประการที่ถูกนำเข้ามาในการอัปเกรดซอฟต์แวร์เวอร์ชัน v1.72 การหยุดทำงานเกิดขึ้นขณะตัวตรวจสอบ (validators) พยายามแก้ไขปัญหาที่เกี่ยวข้องกับคุณสมบัติยอดเงินที่อยู่ใหม่และปัญหาสถานะความสุ่มอีกประการหนึ่ง ตามที่องค์กรระบุ ไม่มีเงินทุนของผู้ใช้ใดที่เสี่ยงต่อความเสียหาย และไม่มีธุรกรรมใดที่ถูกยกเลิกในระหว่างการกู้คืน
ข้อผิดพลาดในการชาร์จแก๊สทำให้เกิดการหยุดให้บริการครั้งแรกสองครั้ง
การหยุดทำงานครั้งแรกเริ่มขึ้นประมาณ 7 นาฬิกาเช้าตามเวลาแปซิฟิกในวันพฤหัสบดี และดำเนินไปจนถึงประมาณ 1:30 น. ตามเวลาแปซิฟิก อย่างไรก็ตาม การหยุดทำงานครั้งที่สองเกิดขึ้นในช่วงเช้าวันศุกร์หลังจากตัวตรวจสอบได้ดำเนินการแก้ไขชั่วคราว
ตามที่ Sui Foundation ระบุ ความผิดปกติทั้งสองเกิดจากข้อบกพร่องที่เกี่ยวข้องกับการเรียกเก็บค่าแก๊สและคุณสมบัติยอดเงินที่อยู่ใหม่ที่เพิ่งเปิดตัว ปัญหานี้ปรากฏขึ้นเมื่อธุรกรรมที่แข่งขันกันเพื่อใช้เงินเดียวกันทำให้เกิดข้อผิดพลาด InsufficientFundsForWithdraw
แม้ว่าธุรกรรมจะถูกยกเลิก แต่ขั้นตอนการประมวลผลแก๊สที่ตามมาได้พยายามใช้ยอดคงเหลือเดียวกันอีกครั้ง ผลลัพธ์คือตัวตรวจสอบพบยอดคงเหลือติดลบระหว่างการปิดการชำระเงิน ทำให้โหนดล่ม
เพื่อฟื้นการดำเนินงานอย่างรวดเร็ว ทีม Sui Core ได้เสนอการแก้ไขชั่วคราวในวันพฤหัสบดี อย่างไรก็ตาม ทีมงานยอมรับว่ายังมีความเสี่ยงที่มีความน่าจะเป็นต่ำอยู่ในแนวทางแก้ไขชั่วคราวนี้
ในทางกลับกัน เครือข่ายจึงประสบปัญหาเดียวกันอีกครั้งในช่วงเช้าวันศุกร์ ทำให้เกิดการหยุดให้บริการครั้งที่สอง ก่อนที่ตัวตรวจสอบจะดำเนินการแก้ไขอย่างครอบคลุมยิ่งขึ้น
ข้อผิดพลาดด้านความสุ่มทำให้เกิดการหยุดทำงานครั้งที่สาม
หลังจากการกู้คืนครั้งที่สอง เครือข่ายทำงานปกติจนถึงการเปลี่ยนแปลงยุคที่กำหนดไว้ในช่วงบ่ายวันศุกร์ ณ จุดนั้น ข้อผิดพลาดที่แยกต่างหากได้กระตุ้นการหยุดทำงานครั้งที่สาม
ตามที่องค์กรระบุ ตัวตรวจสอบ ได้เริ่มติดตั้งการแก้ไขวันศุกร์อีกครั้ง แต่ไม่สามารถตอบสนองข้อกำหนดการมีส่วนร่วมสำหรับการสร้างกุญแจกระจายได้ ตามการออกแบบ กระบวนการนี้ได้ปิดใช้งานความสุ่มสำหรับช่วงเวลา
อย่างไรก็ตาม ข้อบกพร่องที่ซ่อนอยู่ทำให้ตัวตรวจสอบไม่สามารถรักษาสถานะนั้นไว้ได้ระหว่างการรีสตาร์ท ผลที่ตามมาคือ รายการธุรกรรมที่ขึ้นอยู่กับความสุ่มยังคงไม่ได้รับการแก้ไข ทำให้เกิดการสะสมของคิวและป้องกันไม่ให้ยุคปิดลง
การหยุดทำงานเกิดขึ้นตั้งแต่ประมาณ 1:30 น. ตามเวลาแปซิฟิกจนถึง 7:20 น. ตามเวลาแปซิฟิกในวันศุกร์
Foundation ระบุการแก้ไขและบทเรียน
หลังจากเหตุการณ์ดังกล่าว ตัวตรวจสอบได้แก้ไขข้อผิดพลาดทั้งสองด้าน ได้แก่ ข้อผิดพลาดในการเรียกเก็บแก๊สและข้อผิดพลาดของสถานะความสุ่ม นอกจากนี้ องค์กรยังได้แนะนำกลไกที่อนุญาตให้ตัวตรวจสอบปิดยุคที่ค้างอยู่โดยบังคับเมื่อจำเป็น
รายงานยังเน้นพื้นที่ที่ต้องปรับปรุง ได้แก่ เลขน้ำหนักค่าแก๊ส ความทนทานเมื่อสิ้นสุดยุค และการจำกัดความล้มเหลว นอกจากนี้ Sui Foundation ระบุว่าตัวแทน AI ช่วยให้วิศวกรวิเคราะห์บันทึกผู้ตรวจสอบ ข้อมูลการผลิต และตัวชี้วัดเครือข่ายระหว่างการหยุดทำงานเพื่อวินิจฉัยเหตุการณ์ได้เร็วขึ้น


