- Ang Sui’s v1.72 upgrade ay nagdulot ng dalawang magkakaibang bug na nagresulta sa tatlong mainnet outages.
- Ang mga unang dalawang paghinto ay nagmula sa isang kakulangan sa pagbabayad ng gas na kaugnay ng mga bagong balanse ng address.
- Isang hiwalay na bug sa randomness-state ang nag-trigger sa ikatlong pag-antala pagkatapos muling i-start ang mga validator.
Ipinakalabas ng Sui Foundation ang detalyadong post-mortem na nagpapaliwanag sa tatlong hiwalay na paghinto na humadlang sa network noong Mayo 28 at Mayo 29.
Ayon sa foundation, dalawang bug na ipinakilala sa pamamagitan ng v1.72 software release ang nagdulot ng mga pagkabigo. Ang mga insidente ay nagpaputol ng Layer-1 blockchain nang tatlong beses sa loob ng higit sa dalawang araw at nag-trigger ng malaking pagbaba sa presyo ng SUI token.
Bumaba ang SUI ng halos 8% sa panahon ng serye ng outage patungo sa isang mababang halaga sa paligid ng $0.90. Ang token ay nakatradar sa paligid ng $0.90 noong Lunes at bumaba ng halos 19% sa loob ng linggo.
Sinabi ng foundation na walang pondo ng user ang nasa panganib sa anumang pagkakasira at walang natapos na transaksyon ang binago.
Napagana ang Bagong Feature na Nagdulot ng Pagkabigo sa Pagbabayad ng Gas
Ang unang dalawang pagkabigo ay nauugnay sa isang kakulangan sa sistema ng pagbabayad ng gas ng network. Ang bersyon 1.72 ay ipinakilala ang “mga balanse ng address,” isang tampok na disenyo upang payagan ang mga gumagamit na magbayad ng mga bayarin sa transaksyon diretso mula sa mga balanse ng account替代品而不是完全依赖硬币对象。
Ang update ay nagdala rin ng mga bagong path ng pagbabayad na nagkakaisa ang balanse ng address kasama ang tradisyonal na mga pagbabayad batay sa coin. Ang problema ay lumabas nang maraming transaksyon ang sumubok na gastusin ang parehong balanse nang sabay-sabay.
Sa ilang kaso, maaaring kanselahin ang isang transaksyon dahil kulang ang available na pondo. Gayunpaman, ang bahagi pa rin ng gas-processing system ay sinubukan pang kumuha ng mga pondo pagkatapos ng pagkansela. Ito ang naglikha ng negative balance sa panahon ng settlement, na nagdulot ng pag-crash sa mga validator.
Nagsimula ang unang pagkabigo sa paligid ng 7 a.m. PT noong Mayo 28 at tumagal hanggang sa halos 1:30 p.m. PT. Upang mabilis na mabawi ang network, ang mga developer ay nag-deploy ng pansamantalang solusyon. Kinilala ng koponan noong panahong iyon na ang patch ay naglalaman ng kilalang maliit na panganib na maaari pa ring huminto sa network. Gayunpaman, nangyari ang panganib sa susunod na umaga.
Ang emergency patch ay nagdulot ng pangalawang paghinto
Nagsimula ang pangalawang pagkabigo sa paligid ng 5 a.m. PT noong Mayo 29. Sui ay sinabi na maaaring magkamali ang ilang transaksyon dahil sa maraming dahilan nang sabay-sabay. Sa isang skenaryo, ang error na kulang sa pondo na inilalarawan ng patch ay napalikuan ng isa pang error sa pagkansela.
Dahil ang orihinal na error ay nakatago, ang pansamantalang solusyon ay hindi nakatigil sa pag-uulit ng parehong kondisyon ng negatibong balanse.
Nag-crash muli ang mga validator sa pangalawang pagkakataon dahil sa parehong problema ng underflow. Nakumpleto ng mga developer ang mas komprehensibong pag-aayos, at sapat na mga validator ang nag-upgrade upang mabawi ang network sa paligid ng 9:40 a.m. PT.
Nagdulot ang bug sa pagkakasunduin ng ikatlong paghinto
Hindi kaugnay ng gas bug ang ikatlong pagkabigo. Pagkatapos muling i-start ang mga validator upang i-install ang pangalawang pagpapabuti, bumaba ang pakikilahok sa proseso ng paghahanda ng randomisasyon ng network sa ilalim ng kinakailangang porsyento.
Ang sistema ng pagkakasunduin ay sarili nang dinisableng ayon sa disenyo. Gayunpaman, isang hiwalay na bug ang nagpigil sa mga validator na i-save ang natapos na estado sa disk. Kapag muli nilang i-restart ang mga validator, mali silang isinupos na patuloy pa ang proseso ng pagkakasunduin.
Ang mga aplikasyon na nakasalalay sa on-chain randomness ay hindi nakapag-execute o mag-fail, na nagresulta sa pag-akumula ng mga transaksyon sa isang paused queue. Nagsawa ang network sa susunod na epoch transition dahil hindi ito nakakapag-clear ng buong queue.
Nagsimula ang ikatlong paghinto sa paligid ng 1:30 p.m. PT at tumagal hanggang sa halos 7:20 p.m. PT. Nilutas ng mga developer ang bug sa pagpapanatili at idinagdag ang isang bagong mekanismo na nagpapahintulot sa mga validator na piliting isara ang isang nag-stall na epoch kapag kinakailangan.
Ipinakita rin ng foundation na ang mga panloob na kasangkapan na may AI ay nakatulong sa mga inhinyero na mas mabilis na matukoy ang mga insidente sa pamamagitan ng pagtanong sa mga log ng validator, pag-analyze ng production data, at pagbuo ng mga operasyonal na metric habang nagpapalit ng pagpapalit.
Kaugnay: Ulitang Nagsasara ang Sui Mainnet, Nagdudulot ng Pag-aalala sa Pagkakatotoo
Paalala: Ang impormasyon na nakapaloob sa artikulong ito ay para sa layuning impormatibo at edukasyonal lamang. Ang artikulo ay hindi nagtataglay ng anumang payo sa pananalapi o anumang uri ng payo. Ang Coin Edition ay hindi responsable sa anumang mga pagkawala na naganap bilang resulta ng paggamit ng nilalaman, produkto, o serbisyo na nabanggit. Inirerekomenda sa mga mambabasa na magpakatotoo bago gawin ang anumang aksyon na may kinalaman sa kumpanya.

