Sebuah mesin baru saja menyelesaikan masalah matematik yang membingungkan manusia selama puluhan tahun. AlphaProof Nexus milik Google DeepMind, sebuah sistem yang menggabungkan model bahasa besar dengan pembantu bukti formal Lean, telah secara autonom mengatasi 9 daripada 353 masalah Erdős yang belum terpecahkan dan membuktikan 44 daripada 492 konjektur yang belum terpecahkan dari Ensiklopedia Online Jujukan Integer (OEIS).
Kos per masalah: beberapa ratus dolar. Masalah-masalah itu sendiri, dalam beberapa kes, belum diselesaikan selama lebih lama daripada kebanyakan orang yang membaca ini telah hidup.
Apa yang sebenarnya dilakukan oleh AlphaProof Nexus
AlphaProof Nexus menangani ilusi AI dengan menggabungkan kapasiti generatif model AI dengan pemeriksaan bukti formal melalui pembantu bukti Lean. AI mencadangkan satu bukti, kemudian sistem pengesahan yang berasingan memeriksa setiap langkah logik. Jika bukti tidak berterusan, ia akan ditolak.
Keputusan telah didokumenkan dalam pra-cetak arXiv (2605.22763v1) yang diterbitkan pada 21 Mei 2026. Semua bukti formal dan versi bahasa semula yang dipilih telah disediakan dalam repositori GitHub yang dikemas kini antara 20 dan 22 Mei 2026. Masalah contoh yang ditangani termasuk varian #125, #138, #741, dan #12 dari katalog masalah Erdős, dengan bukti dibahagikan melalui perbincangan di erdosproblems.com.
Sistem ini menggunakan apa yang DeepMind sebut sebagai "agentic loops" yang berkaitan dengan pemeriksaan bukti, pengulangan dan penyempurnaan bukti terhadap pemeriksa formal sehingga ia berjaya atau sistem menyimpulkan ia tidak dapat menyelesaikan masalah tersebut.
Varian agen asas sistem juga menyelesaikan 9 masalah Erdős, tetapi dengan kos pengkomputan yang lebih tinggi, menunjukkan bahawa arkaitektur Nexus penuh lebih cekap berbanding lebih berupaya dari segi mentah.
Mengapa masalah Erdős penting
Paul Erdős adalah salah seorang ahli matematik paling produktif dalam sejarah, bertanggungjawab atas penubuhan ratusan masalah dalam kombinatorik, teori nombor, dan teori graf. Banyak daripada masalah ini disertai dengan hadiah tunai yang diletakkan sendiri olehnya.
Menyelesaikan 9 daripada 353 masalah Erdős yang terbuka adalah sekitar 2.5%. Setiap satu mewakili sempadan pengetahuan matematik di mana ahli matematik profesional telah membuat sedikit atau tiada kemajuan, kadang-kadang selama beberapa dekad.
Membuktikan 44 daripada 492 konjektur OEIS yang terbuka, kira-kira 9%, menunjukkan bahawa sistem ini boleh beroperasi merentasi pelbagai domain matematik, bukan hanya berspesialisasi secara sempit.
AlphaProof Nexus membina kerja sebelumnya DeepMind dengan AlphaProof, yang mencapai prestasi peringkat gangsa di Olimpiad Matematik Antarabangsa 2024. Lompatan daripada penyelesaian Olimpiad kepada pembuktian peringkat penyelidikan adalah signifikan: masalah Olimpiad direka untuk dapat diselesaikan dalam beberapa jam oleh manusia berbakat, manakala masalah penyelidikan terbuka tidak mempunyai jaminan sedemikian.
Apa yang ini maksudkan untuk pengesahan AI dan kripto
AlphaProof Nexus tidak mempunyai hubungan langsung dengan kripto, aset digital, atau token. DeepMind membina ini untuk penyelidikan matematik, dengan aplikasi yang dijangkakan dalam kombinatorik, geometri algebra, dan pengoptimuman.
Teknologi inti, pengesahan formal berdayakan AI, berada di persimpangan beberapa isu yang menjadi perhatian industri kripto. Pemeriksaan kontrak pintar, penghasilan bukti tanpa pengetahuan, dan pengesahan protokol kriptografi semuanya bergantung pada kemampuan asas yang sama: memastikan bahawa pernyataan logik adalah betul secara boleh dibuktikan.
Pengesahan formal ialah proses membuktikan secara matematik bahawa perisian berkelakuan seperti yang dimaksudkan. Ia secara sejarah mahal dan perlahan, memerlukan kecekapan manusia yang khusus. Sistem yang mampu menghasilkan dan mengesahkan bukti formal secara autonomi untuk beberapa ratus dolar setiap masalah mengubah ekonomi persamaan itu.
Bukti tanpa pengetahuan, teknik kriptografi yang menjadi dasar blok rantai yang menekankan privasi dan penyelesaian penskalaan lapisan-2, memerlukan pembinaan matematik yang ketat. Kesilapan dalam rekabentuk litar ZK boleh membahayakan privasi dan keselamatan.
