主網宕機導致交易中斷六小時後,隋文雄發布了事後分析報告。
隋基金會已發布詳細的事後分析報告,解釋了導致主網停滯併中斷交易處理的原因。 1月15日它證實,網絡停止運行是出於安全考慮,以防止狀態最終確定出現不一致的情況。
據該基金會稱,此次中斷持續了大約六小時這是由於驗證者共識處理過程中的內部分歧造成的。
事件期間,驗證器無法認證新的檢查點,導致交易提交超時,而網絡則優先保障安全。
Sui共識分歧觸發安全停牌
基金會據稱,該事件源於共識提交邏輯中的一個極端情況錯誤,該錯誤影響了在某些垃圾回收條件下處理衝突交易的方式。
因此,不同的驗證器得出了不同的共識輸出,並嘗試執行不兼容的候選檢查點。
當驗證者檢測到超過三分之一的權益簽署了不同的檢查點摘要時,檢查點認證變得不可能。 驗證者隨即停止了認證進程,以避免最終確定不一致的狀態。
“這是此類問題的預期故障模式,”該基金會表示,並指出該網絡的設計目的是安全停止,而不是冒著出現分叉或不可逆轉的不一致的風險。
沒有分叉、回滾或資金損失
隋強調,此次卡頓並非由網絡擁堵、交易量過大或外部威脅造成。 事件全程:
- 沒有發生經認證的州分叉
- 沒有回滾任何已認證的交易。
- 用戶資金從未面臨風險
- 網絡安全和一致性保障得以維持。
事件發生期間,事務執行暫停,但讀取操作仍繼續執行,以保持上次認證的狀態。 這確保了用戶和應用程序的數據一致性。
事故後計劃採取改進措施
這隋基金會該公司表示,正在實施多項變革,以縮短未來發生類似問題時的恢復時間。
計劃中的改進措施包括更快地檢測檢查點不一致之處,以及開發更多自動化運維工具來清理內部狀態差異。 此外,還將擴展共識機制相關的測試,以便在部署前重現和驗證修復方案。
基金會補充說,雖然這次中斷造成了混亂,但也證實了隋文棟以安全為中心的設計理念得到了驗證。
最後想說的話
- Sui 的解釋證實,主網停滯是由於共識邊緣情況造成的,安全機制停止了網絡運行,以避免出現不一致的最終狀態。
- 雖然這次事件造成了乾擾,但也凸顯了高吞吐量網絡在挑戰性能極限時,可用性和安全性之間的權衡。