Bir makine, on yıllar boyunca insanları şaşırtan matematik problemlerini çözdü. Google DeepMind’in AlphaProof Nexus adlı sistemi, büyük dil modellerini Lean resmi ispat yardımcı programıyla birleştirerek, 353 açık Erdős probleminden 9’unu ve Online Tamsayı Dizileri Ansiklopedisi’nden (OEIS) 492 açık sanıdan 44’ünü bağımsız olarak çözdü.
Her sorunun maliyeti: birkaç yüz dolar. Bazı durumlarda, bu sorunlar, bunu okuyan çoğu insanın yaşamış olduğu süreden daha uzun süre çözülmemişti.
AlphaProof Nexus'in tam olarak ne yaptığını
AlphaProof Nexus, AI modelinin üretken kapasitesini Lean kanıt yardımcı programı aracılığıyla formel kanıt doğrulama ile birleştirerek AI hayal kırıklığını giderir. AI bir kanıt önerir ve ardından ayrı bir doğrulama sistemi her mantıksal adımı kontrol eder. Kanıt geçersizse, reddedilir.
Sonuçlar, 21 Mayıs 2026 tarihinde yayınlanan bir arXiv ön yazısı (2605.22763v1) ile belgelenmiştir. Tüm resmi ispatlar ve seçilen doğal dil sürümleri, 20-22 Mayıs 2026 tarihleri arasında güncellenen bir GitHub deposunda mevcuttur. Ele alınan örnek problemler arasında Erdős problem kataloğundaki #125, #138, #741 ve #12 numaralı varyasyonlar yer alır; ispatlar erdosproblems.com üzerindeki tartışmalar aracılığıyla paylaşılmıştır.
Sistem, DeepMind'in kanıt denetleme, kanıtları yineleme ve düzeltme ile ilişkili olan "ajentsel döngüler" adını verdiği bir sistemi kullanır; kanıtlar ya doğrulanana kadar ya da sistem sorunun çözülemeyeceğine karar verene kadar formel denetleyiciye karşı test edilir.
Sistemin temel bir ajan varyantı, daha yüksek bir hesaplama maliyetiyle 9 Erdős problemi de çözdü, bu da tam Nexus mimarisinin saf açıdan daha yetenekli değil, daha verimli olduğunu gösteriyor.
Neden Erdős problemleri önemlidir
Paul Erdős, kombinatorik, sayılar teorisi ve graf teorisinde yüzlerce problem ortaya koyan tarihin en verimli matematikçilerinden biriydi. Bu problemlerin birçokına kendi tarafından para ödülleri bağlamıştı.
353 açık Erdős probleminden 9’unu çözmek yaklaşık %2,5’lik bir orandır. Her biri, profesyonel matematikçilerin bazen on yıllar boyunca neredeyse hiçbir ilerleme kaydetmediği matematik bilgisinin bir sınırını temsil eder.
492 açık OEIS sanısından 44'ünü kanıtlamak, yaklaşık %9, sistemin dar bir alana özgü olmak yerine çeşitli matematiksel alanlarda çalışabileceğini göstermektedir.
AlphaProof Nexus, DeepMind'in önceki AlphaProof çalışmasının üzerine inşa edilmiştir ve bu çalışma, 2024 Uluslararası Matematik Olimpiyatları'nda gümüş madalya seviyesinde bir performans göstermiştir. Olimpiyat çözücüden araştırma düzeyinde bir ispatlayıcıya geçiş büyük bir atlamadır: Olimpiyat soruları, yetenekli insanlar tarafından saatler içinde çözülebilecek şekilde tasarlanırken, açık araştırma sorularında böyle bir garanti yoktur.
Bu, AI doğrulama ve kripto için ne anlama geliyor
AlphaProof Nexus, kripto paralara, dijital varlıklara veya tokenlara doğrudan bir bağlantısı yoktur. DeepMind, bu aracı kombinatorik, cebirsel geometri ve optimizasyon alanında beklenen uygulamalar için geliştirmiştir.
Temel teknoloji olan AI tabanlı formel doğrulama, kripto endüstrisinin ilgilendiği birkaç sorunun kesişim noktasında yer alır. Akıllı sözleşme denetimi, sıfır bilgi kanıtı üretimi ve kriptografik protokol doğrulaması, tümü aynı temel yeteneğe dayanır: mantıksal ifadelerin kanıtlanabilir şekilde doğru olduğundan emin olmak.
Resmi doğrulama, yazılımın amaçlandığı gibi davrandığını matematiksel olarak kanıtlama sürecidir. Tarihsel olarak maliyetli ve yavaş olmuş, uzman insan kaynaklarına ihtiyaç duymuştur. Her bir sorun için birkaç yüz dolarla otomatik olarak resmi kanıtlar üretip doğrulayabilen bir sistem, bu denklemin ekonomisini değiştirir.
Sıfır bilgi kanıtı, gizlilik odaklı blok zincirlerini ve katman-2 ölçeklendirme çözümlerini temel alan kriptografik tekniktir ve titiz matematiksel yapılandırma gerektirir. ZK devresi tasarımı hataları, hem gizliliği hem de güvenliği tehlikeye atabilir.
