Sebuah mesin baru saja menyelesaikan masalah matematika yang membingungkan manusia selama puluhan tahun. AlphaProof Nexus dari Google DeepMind, sebuah sistem yang menggabungkan model bahasa besar dengan asisten bukti formal Lean, telah secara otonom menyelesaikan 9 dari 353 masalah Erdős yang belum terpecahkan dan membuktikan 44 dari 492 konjektur yang belum terpecahkan dari Ensiklopedia Online Sebaran Bilangan Bulat (OEIS).
Biaya per masalah: beberapa ratus dolar. Masalah-masalah itu sendiri, dalam beberapa kasus, belum terpecahkan lebih lama dari kebanyakan orang yang membaca ini telah hidup.
Apa yang sebenarnya dilakukan AlphaProof Nexus
AlphaProof Nexus mengatasi ilusi AI dengan menggabungkan kapasitas generatif model AI dengan pemeriksaan bukti formal melalui asisten bukti Lean. AI mengusulkan sebuah bukti, lalu sistem verifikasi terpisah memeriksa setiap langkah logis. Jika bukti tidak valid, ia akan ditolak.
Hasil didokumentasikan dalam preprint arXiv (2605.22763v1) yang diterbitkan pada 21 Mei 2026. Semua bukti formal dan versi bahasa alami terpilih telah tersedia di repositori GitHub yang diperbarui antara 20 dan 22 Mei 2026. Contoh masalah yang ditangani mencakup varian #125, #138, #741, dan #12 dari katalog masalah Erdős, dengan bukti dibagikan melalui diskusi di erdosproblems.com.
Sistem ini menggunakan apa yang disebut DeepMind sebagai “agentic loops” yang terkait dengan pemeriksaan bukti, mengulangi dan menyempurnakan bukti terhadap checker formal hingga bukti tersebut lulus atau sistem menyimpulkan tidak dapat menyelesaikan masalah tersebut.
Varian agen dasar dari sistem ini juga menyelesaikan 9 masalah Erdős, tetapi dengan biaya komputasi yang lebih tinggi, menunjukkan bahwa arsitektur Nexus penuh lebih efisien daripada lebih mampu dalam hal murni.
Mengapa masalah Erdős penting
Paul Erdős adalah salah satu matematikawan paling produktif dalam sejarah, yang bertanggung jawab atas pemunculan ratusan masalah di bidang kombinatorika, teori bilangan, dan teori graf. Banyak dari masalah-masalah ini disertai hadiah uang tunai yang ia pasang sendiri.
Menyelesaikan 9 dari 353 masalah Erdős yang masih terbuka sekitar 2,5%. Setiap satu representasi batas pengetahuan matematis di mana matematikawan profesional hampir tidak membuat kemajuan, terkadang selama puluhan tahun.
Membuktikan 44 dari 492 konjektur OEIS yang terbuka, sekitar 9%, menunjukkan bahwa sistem dapat beroperasi di berbagai bidang matematika daripada berspesialisasi secara sempit.
AlphaProof Nexus membangun pekerjaan sebelumnya DeepMind dengan AlphaProof, yang mencapai kinerja setara medali perak di Olimpiade Matematika Internasional 2024. Lompatan dari solver Olimpiade menjadi pembuktian tingkat penelitian sangat signifikan: soal Olimpiade dirancang agar dapat diselesaikan dalam hitungan jam oleh manusia berbakat, sementara masalah penelitian terbuka tidak memiliki jaminan semacam itu.
Apa artinya ini untuk verifikasi AI dan crypto
AlphaProof Nexus tidak memiliki koneksi langsung dengan cryptocurrency, aset digital, atau token. DeepMind mengembangkan ini untuk penelitian matematis, dengan aplikasi yang diharapkan di kombinatorika, geometri aljabar, dan optimasi.
Teknologi inti, verifikasi formal berbasis AI, berada di persimpangan beberapa masalah yang menjadi perhatian industri kripto. Audit kontrak pintar, generasi zero-knowledge proof, dan verifikasi protokol kriptografi semuanya bergantung pada kemampuan dasar yang sama: memastikan bahwa pernyataan logis secara terbukti benar.
Verifikasi formal adalah proses membuktikan secara matematis bahwa perangkat lunak berperilaku sesuai yang diharapkan. Secara historis, proses ini mahal dan lambat, memerlukan keahlian manusia yang spesialis. Sistem yang dapat secara otomatis menghasilkan dan memvalidasi bukti formal dengan biaya beberapa ratus dolar per masalah mengubah ekonomi persamaan tersebut.
Bukti zero-knowledge, teknik kriptografi yang menjadi dasar blockchain yang berfokus pada privasi dan solusi penskalaan layer-2, memerlukan konstruksi matematis yang ketat. Kesalahan dalam desain sirkuit ZK dapat membahayakan privasi dan keamanan.
