一台機器剛剛解決了困擾人類數十年的數學問題。Google DeepMind 的 AlphaProof Nexus 系統,結合大型語言模型與 Lean 形式化證明助手,已自主破解 9 道開放的 Erdős 問題,並證明了來自線上整數序列百科全書(OEIS)的 492 個開放猜想中的 44 個。
每個問題的成本:數百美元。在某些情況下,這些問題的未解決時間比大多數讀者的生命長度還要久。
AlphaProof Nexus 的實際功能
AlphaProof Nexus 透過將 AI 模型的生成能力與 Lean 證明助手的形式化證明檢查相結合,來解決 AI 幻覺問題。AI 提出證明,然後由獨立的驗證系統檢查每一個邏輯步驟。如果證明無法成立,則會被拒絕。
結果已記錄於 2026 年 5 月 21 日發布的 arXiv 預印本(2605.22763v1)中。所有正式證明及選定的自然語言版本均已於 2026 年 5 月 20 日至 22 日更新的 GitHub 倉儲中提供。所處理的範例問題包括 Erdős 問題目錄中的變體 #125、#138、#741 和 #12,證明已透過 erdosproblems.com 上的討論分享。
該系統使用 DeepMind 所稱的「代理迴圈」,與證明檢查相關,反覆迭代並根據形式化檢查器優化證明,直到證明通過或系統判定無法解決該問題為止。
該系統的一種基本代理變體也解決了 9 個 Erdős 問題,但計算成本更高,這表明完整的 Nexus 架構在純粹能力上並非更強,而是更高效。
為何愛爾多斯問題至關重要
保羅·艾狄胥是歷史上最多產的數學家之一,提出了大量組合數學、數論和圖論領域的問題。其中許多問題都附有他親自設立的現金獎勵。
解決 353 個開放的 Erdős 問題中的 9 個,約佔 2.5%。每個問題都代表數學知識的前沿,專業數學家在這方面幾乎沒有進展,有時甚至長達數十年。
證明 44 個出於 492 個開放的 OEIS 猜想,約 9%,顯示該系統能在多個數學領域中運作,而非僅限於狹窄的專業領域。
AlphaProof Nexus 基於 DeepMind 之前在 AlphaProof 上的工作,該工作在 2024 年國際數學奧林匹克競賽中達到了銀牌水平的表現。從奧林匹克問題求解器躍升至研究級證明器是巨大的進步:奧林匹克問題設計為由有才華的人類在數小時內解決,而開放的研究問題則沒有此類保證。
這對 AI 驗證和加密貨幣意味著什麼
AlphaProof Nexus 與加密貨幣、數碼資產或代幣無直接關聯。DeepMind 建立此系統用於數學研究,預期應用於組合數學、代數幾何和優化領域。
核心技術 AI 驅動的形式化驗證,位於加密行業關注的多個問題的交集點。智能合約審計、零知識證明生成和密碼協議驗證都依賴於同一項基本能力:確保邏輯陳述可被證明正確。
形式驗證是通過數學方法證明軟體按預期運作的過程。歷史上,這一過程成本高昂且耗時,需要專業的人工專家。一個能以每問題幾百美元的價格自主生成並驗證形式證明的系統,徹底改變了這一成本結構。
零知識證明是支撐注重隱私的區塊鏈和第二層擴容解決方案的加密技術,需要嚴謹的數學構造。ZK 電路設計中的錯誤可能會損害隱私和安全性。
