Машина розв’язала математичні задачі, які були непосильними для людей десятиліттями. Google DeepMind’s AlphaProof Nexus — система, що поєднує великі мовні моделі з формальним асистентом доведень Lean — автономно розв’язала 9 із 353 відкритих проблем Ердеша та довела 44 із 492 відкритих гіпотез з Онлайн-енциклопедії цілочислових послідовностей (OEIS).
Вартість за проблему: кілька сотень доларів. Самі проблеми в деяких випадках залишалися нерозв’язаними довше, ніж живуть більшість читачів цього.
Що насправді робить AlphaProof Nexus
AlphaProof Nexus вирішує проблему ілюзій ШІ, поєднуючи генеративний потенціал моделі ШІ з формальною перевіркою доведень за допомогою інструменту Lean. ШІ пропонує доведення, а потім окрема система перевіряє кожен логічний крок. Якщо доведення не витримує перевірки, воно відхиляється.
Результати було задокументовано у передрукові arXiv (2605.22763v1), опублікованому 21 травня 2026 року. Усі формальні доведення та вибрані версії природною мовою доступні у репозиторії GitHub, який оновлювався з 20 по 22 травня 2026 року. Прикладами розв’язаних задач є варіанти #125, #138, #741 та #12 з каталогу проблем Ердеша, доведення яких поділено через обговорення на erdosproblems.com.
Система використовує те, що DeepMind називає «агентними циклами», пов’язаними з перевіркою доведень, ітераціями та удосконаленням доведень за допомогою формального перевірника, доки вони не пройдуть перевірку або система не висновує, що не може вирішити проблему.
Базова версія агента системи також розв’язала 9 задач Ердеша, але з більшою обчислювальною вартістю, що свідчить про те, що повна архітектура Nexus є більш ефективною, а не більш здатною в сирому виразі.
Чому проблеми Ердеша мають значення
Пол Ердеш був одним із найплідніших математиків в історії, який сформулював сотні задач у галузях комбінаторики, теорії чисел і теорії графів. Багато з цих задач супроводжувалися грошовими нагородами, які він особисто призначив.
Розв’язання 9 із 353 відкритих проблем Ердеша становить приблизно 2,5%. Кожна з них — це межа математичних знань, де професійні математики зробили мало або взагалі ніякого прогресу, іноді протягом десятиліть.
Доведення 44 із 492 відкритих гіпотез OEIS, приблизно 9%, демонструє, що система може працювати в різних математичних галузях, а не є вузькоспеціалізованою.
AlphaProof Nexus базується на попередніх роботах DeepMind з AlphaProof, який досяг результату рівня срібної медалі на Міжнародній математичній олімпіаді 2024 року. Перехід від розв’язувача олімпіадних задач до доводчика дослідницького рівня є значним: олімпіадні задачі розроблені так, щоб їх можна було розв’язати за кілька годин талановитим людям, тоді як відкриті дослідницькі задачі не мають такої гарантії.
Що це означає для перевірки ШІ та криптовалют
AlphaProof Nexus не має прямого зв’язку з криптовалютами, цифровими активами чи токенами. DeepMind розробив це для математичних досліджень з передбачуваними застосуваннями в комбінаториці, алгебраїчній геометрії та оптимізації.
Основна технологія — формальна верифікація на основі ШІ — знаходиться на перетині кількох проблем, які цікавлять криптоіндустрію. Аудит смартконтрактів, генерація доказів із нульовим розголошенням та верифікація криптографічних протоколів всі залежать від однієї фундаментальної здатності: забезпечення того, що логічні твердження є доведено правильними.
Формальна верифікація — це процес математичного доведення того, що програмне забезпечення працює так, як задумано. Раніше вона була дорога і повільна, вимагаючи спеціалізованих людських знань. Система, яка може автономно генерувати та перевіряти формальні доведення за кілька сотень доларів за завдання, змінює економіку цього рівняння.
Докази із нульовим розголошенням — криптографічна техніка, що лежить в основі блокчейнів і рішень для масштабування рівня 2, орієнтованих на конфіденційність, — вимагають строгого математичного конструювання. Помилки в проектуванні ZK-кіл можуть погіршити як конфіденційність, так і безпеку.
