Une machine vient de résoudre des problèmes mathématiques qui avaient défié les humains pendant des décennies. AlphaProof Nexus de Google DeepMind, un système qui fusionne des modèles linguistiques de grande taille avec l'assistant de preuve formelle Lean, a résolu de manière autonome 9 problèmes d'Erdős ouverts sur 353 et démontré 44 conjectures ouvertes sur 492 de l'Encyclopédie en ligne des suites d'entiers (OEIS).
Le coût par problème : quelques centaines de dollars. Les problèmes eux-mêmes avaient, dans certains cas, demeuré non résolus plus longtemps que la plupart des lecteurs de ce texte n’ont vécu.
Ce que fait réellement AlphaProof Nexus
AlphaProof Nexus lutte contre les hallucinations de l'IA en associant la capacité générative d'un modèle d'IA à une vérification formelle grâce à l'assistant de preuve Lean. L'IA propose une preuve, puis un système de vérification distinct vérifie chaque étape logique. Si la preuve ne tient pas, elle est rejetée.
Les résultats ont été documentés dans une prépublication arXiv (2605.22763v1) publiée le 21 mai 2026. Toutes les preuves formelles et les versions en langage naturel sélectionnées sont disponibles sur un dépôt GitHub mis à jour entre le 20 et le 22 mai 2026. Les problèmes traités incluent les variantes #125, #138, #741 et #12 du catalogue de problèmes d’Erdős, avec des preuves partagées via des discussions sur erdosproblems.com.
Le système utilise ce que DeepMind appelle des « boucles agentic » associées à la vérification des preuves, en itérant et en affinant les preuves contre le vérificateur formel jusqu'à ce qu'elles passent ou que le système conclue qu'il ne peut pas résoudre le problème.
Une variante de base de l'agent a également résolu 9 problèmes d'Erdős, mais à un coût computationnel plus élevé, ce qui suggère que l'architecture Nexus complète est plus efficace, et non plus performante en termes bruts.
Pourquoi les problèmes d'Erdős comptent
Paul Erdős était l'un des mathématiciens les plus prolifiques de l'histoire, ayant posé des centaines de problèmes en combinatoire, théorie des nombres et théorie des graphes. Beaucoup de ces problèmes étaient accompagnés de récompenses en espèces qu'il avait personnellement fixées.
Résoudre 9 des 353 problèmes d’Erdős ouverts représente environ 2,5 %. Chacun d’eux représente une frontière du savoir mathématique où les mathématiciens professionnels ont peu ou pas progressé, parfois pendant des décennies.
La preuve de 44 conjectures sur 492 ouvertes dans l'OEIS, soit environ 9 %, démontre que le système peut opérer à travers une variété de domaines mathématiques plutôt que d'être étroitement spécialisé.
AlphaProof Nexus s'appuie sur les travaux précédents de DeepMind avec AlphaProof, qui a obtenu une performance de niveau médaille d'argent à l'Olympiade Internationale de Mathématiques 2024. Le passage d'un solveur d'olympiades à un prouveur de niveau recherche est considérable : les problèmes d'olympiades sont conçus pour être résolubles en quelques heures par des humains talentueux, tandis que les problèmes de recherche ouverts n'offrent aucune telle garantie.
Ce que cela signifie pour la vérification de l'IA et la crypto
AlphaProof Nexus n'a aucun lien direct avec les cryptomonnaies, les actifs numériques ou les jetons. DeepMind l'a développé à des fins de recherche mathématique, avec des applications attendues en combinatoire, géométrie algébrique et optimisation.
La technologie centrale, la vérification formelle pilotée par l'IA, se situe à l'intersection de plusieurs problèmes qui intéressent l'industrie de la cryptomonnaie. L'audit de contrats intelligents, la génération de preuves à divulgation nulle de connaissance et la vérification de protocoles cryptographiques reposent tous sur la même capacité fondamentale : garantir que les déclarations logiques sont prouvables comme correctes.
La vérification formelle est le processus consistant à prouver mathématiquement qu'un logiciel se comporte comme prévu. Elle a historiquement été coûteuse et lente, nécessitant une expertise humaine spécialisée. Un système capable de générer et de valider automatiquement des preuves formelles pour quelques centaines de dollars par problème change l'équation économique.
Les preuves à divulgation nulle de connaissance, la technique cryptographique à la base des blockchains axées sur la vie privée et des solutions d'évolutivité de couche 2, nécessitent une construction mathématique rigoureuse. Des erreurs dans la conception des circuits ZK peuvent compromettre à la fois la vie privée et la sécurité.
