- Dalawang pagkabigo ay nagmula sa isang bug sa pag-charge ng gas na nagdulot ng pag-crash ng validator kapag nag-trigger ang mga nabigong transaksyon sa mga error sa balanse.
- Isang hiwalay na bug sa randomness-state ang nagdulot sa ikatlong paghinto sa pamamagitan ng pagpigil sa mga validator na tamang pagsasara ng isang epoch ng network.
- Sui ay nagsabi na walang apektadong pera ng user, isinagawa ang mga pag-aayos, at idinagdag ang mga panatilihan upang mapabuti ang katatagan ng network.
Noong Linggo, ang Sui Foundation inilahad ang mga sanhi ng tatlong mainnet outage na nagdulot ng pagkabigo sa network operations noong Miyerkules at Huwebes, na pinagmulan sa dalawang magkakahiwalay na bug na ipinakilala sa v1.72 software upgrade. Ang mga outage ay nangyari habang ang mga validator ay nagtatrabaho upang harapin ang mga isyu na may kinalaman sa bagong address balances feature at isang hiwalay na randomness-state problem. Ayon sa foundation, walang user funds ang nasa panganib at walang nakomit na transaksyon ang binawi sa panahon ng pagpapalit.
Ang gas-charging bug ang nag-trigger sa unang dalawang outages
Ang unang pagkabigo ay nagsimula sa paligid ng 7 a.m. PT sa Huwebes at tumagal hanggang sa halos 1:30 p.m. PT. Gayunpaman, sumunod ang ikalawang paghinto noong Friday morning pagkatapos mong i-deploy ang mga validator ang pansamantalang solusyon.
Ayon sa Sui Foundation, ang parehong pagkabigo ay nagmula sa isang kamalian na may kinalaman sa gas charging at ang bagong ipinakilalang tampok ng balanse ng address. Lumabas ang problema nang ang mga transaksyon na kumakalaban para sa parehong pondo ay nag-trigger ng InsufficientFundsForWithdraw error.
Bagaman kinansela ang transaksyon, sinubukan ng mga susunod na hakbang sa pagproseso ng gas na gastusin muli ang parehong balanse. Bilang resulta, nakakita ang mga validator ng negative balance habang nagpapasya, na nagresulta sa pag-crash ng mga node.
Upang muling iayos ang operasyon nang mabilis, ang Sui Core Team ay nagpropose ng pansamantalang solusyon noong Huwebes. Gayunpaman, kilala ng team na nananatili ang isang kilalang mababang posibilidad ng panganib sa pansamantalang solusyon na iyon.
Kaya naman, ang network ay nakaranas ng variation ng parehong problema noong Friday morning, na nagresulta sa pangalawang outage bago mag-implement ang mga validator ng mas komprehensibong solusyon.
Nagdulot ang bug sa randomness ng ikatlong paghinto
Pagkatapos ng ikalawang pagpapalikod, normal ang paggana ng network hanggang sa susunod na iskedyuladong pagbabago ng epoch sa Friday afternoon. Sa punto na iyon, nag-trigger ang isang hiwalay na bug sa ikatlong pagkabigo.
Ayon sa foundation, validators ay muli nagsimula na i-install ang Friday fix ngunit hindi nakamit ang mga kinakailangang partisipasyon para sa distributed key generation. Ayon sa disenyo, pinagpaputol ng proseso ang randomness para sa epoch.
Gayunpaman, isang nakatagong bug ang nagbawal sa mga validator na panatilihin ang katayuan na iyon sa pagkakarestart. Bilang resulta, ang mga transaksyon na nakadepende sa randomness ay nanatiling hindi nalulutas, na nagdulot ng pagkakabuo ng queue na nagbawal sa pagkakasara ng epoch.
Ang pagkabigo ay tumagal mula sa halos 1:30 p.m. PT hanggang 7:20 p.m. PT sa Friday.
Ipinapakita ng Foundation ang mga pagpapabuti at mga aral
Pagkatapos ng mga insidente, tinamaan ng mga validator ang parehong bug sa pagbabayad ng gas at sa randomness-state. Dagdag pa rito, ipinakilala ng foundation ang isang mekanismo na nagpapahintulot sa mga validator na pagsagwan ang isang stalled na epoch kapag kinakailangan.
Nilahad din ng ulat ang mga lugar na kailangang pagbutihin, kabilang ang logika ng pagbabayad ng gas, pagkakaroon ng katatagan sa dulo ng epoch, at pagkakasaklaw ng pagkabigo. Bukod dito, sinabi ng Sui Foundation na tumulong ang AI agents sa mga inhinyero na mas mabilis na masuri ang mga insidente sa pamamagitan ng pagsusuri sa mga log ng validator, produksyon na data, at mga metric ng network habang nangyari ang pagkabigo.


