- 兩次中斷源於一項氣體充值漏洞,該漏洞會在失敗的交易觸發餘額錯誤時導致驗證節點崩潰。
- 一個獨立的隨機性狀態錯誤導致第三次中止,原因是阻止驗證者正確關閉網路週期。
- Sui 表示沒有用戶資金受到影響,已實施修復措施並增加保障,以提升網絡的韌性。
Sui 基金會於週日 詳述 了導致週四和週五主網中斷的三起停機事件的原因,並將這些事件歸因於 v1.72 軟體升級中引入的兩個獨立漏洞。這些停機事件發生時,驗證節點正在處理與新地址餘額功能相關的問題以及一個獨立的隨機性狀態問題。根據基金會的說法,用戶資金並未面臨風險,且在恢復過程中也沒有任何已確認的交易被撤銷。
氣體充電漏洞引發前兩次停機
第一次中斷於週四上午7時(太平洋時間)開始,持續至約下午1:30(太平洋時間)。然而,在驗證者部署臨時修復方案後,週五上午又出現了第二次中斷。
根據 Sui Foundation 的說明,這兩次中斷均源於與 Gas 費用收取及新引入的地址餘額功能相關的缺陷。當競爭同一筆資金的交易觸發 InsufficientFundsForWithdraw 錯誤時,該問題便會出現。
雖然交易已被取消,但後續的汽油處理步驟仍嘗試再次支出相同餘額。因此,驗證者在結算時遇到穿倉,導致節點崩潰。
為迅速恢復運作,Sui 核心團隊於週四提出了一項臨時解決方案。然而,該團隊承認,該臨時方案中仍存在已知的低概率風險。
因此,網路於週五上午再次遇到相同問題的變體,導致在驗證者實施更全面的修復之前發生了第二次中斷。
隨機性錯誤導致第三次中止
在第二次恢復後,網絡運行正常,直至週五下午下一次預定的紀元變更。在該時點,另一個漏洞觸發了第三次中斷。
根據基金會的說法,驗證者重新開始安裝週五的修補程式,但未能達到分散式金鑰生成的參與要求。根據設計,該過程已禁用該紀元的隨機性。
然而,一個潛在的錯誤導致驗證者無法在重啟後保留該狀態。因此,依賴隨機性的交易一直未解決,造成佇列積壓,使紀元無法關閉。
停機時間從週五下午 1:30 PT 左右持續至 7:20 PT。
基金會概述修復與經驗教訓
事件發生後,驗證者修復了氣體收費和隨機狀態的錯誤。此外,基金會引入了一種機制,允許驗證者在必要時強制關閉滯後的週期。
該報告還指出了需要改進的領域,包括燃氣收費邏輯、紀元結束時的彈性以及故障隔離。此外,Sui基金會表示,AI代理在停機期間通過分析驗證者日誌、生產數據和網絡指標,幫助工程師更快地診斷事件。


