Google DeepMind's AlphaProof Nexus resuelve 9 problemas de Erdős y 44 conjeturas de OEIS

Una máquina acaba de resolver problemas matemáticos que desconcertaron a los humanos durante décadas. AlphaProof Nexus de Google DeepMind, un sistema que combina modelos de lenguaje grande con el asistente de prueba formal Lean, ha resuelto de forma autónoma 9 de 353 problemas abiertos de Erdős y demostrado 44 de 492 conjeturas abiertas de la Enciclopedia en línea de sucesiones de enteros (OEIS).

El costo por problema: unos pocos cientos de dólares. Los propios problemas habían permanecido sin resolver, en algunos casos, más tiempo del que la mayoría de los lectores de esto han vivido.

Lo que realmente hace AlphaProof Nexus

AlphaProof Nexus aborda las alucinaciones de IA emparejando la capacidad generativa de un modelo de IA con la verificación formal de pruebas mediante el asistente de prueba Lean. La IA propone una prueba, y luego un sistema de verificación independiente revisa cada paso lógico. Si la prueba no se sostiene, se rechaza.

Los resultados fueron documentados en una preimpresión de arXiv (2605.22763v1) publicada el 21 de mayo de 2026. Todas las pruebas formales y versiones seleccionadas en lenguaje natural están disponibles en un repositorio de GitHub actualizado entre el 20 y el 22 de mayo de 2026. Los problemas de ejemplo abordados incluyen las variantes #125, #138, #741 y #12 del catálogo de problemas de Erdős, con pruebas compartidas a través de discusiones en erdosproblems.com.

El sistema utiliza lo que DeepMind llama "bucles agentes" asociados con la verificación de pruebas, iterando y refinando pruebas contra el verificador formal hasta que pasen o el sistema concluya que no puede resolver el problema.

Anuncio

Una variante básica del agente también resolvió 9 problemas de Erdős, pero con un costo computacional mayor, lo que sugiere que la arquitectura completa de Nexus es más eficiente, no más capaz en términos brutos.

Por qué importan los problemas de Erdős

Paul Erdős fue uno de los matemáticos más prolíficos de la historia, responsable de plantear cientos de problemas en combinatoria, teoría de números y teoría de grafos. Muchos de estos problemas incluyen recompensas en efectivo que él mismo asignó.

Resolver 9 de 353 problemas abiertos de Erdős es aproximadamente el 2.5%. Cada uno representa una frontera del conocimiento matemático donde los matemáticos profesionales han logrado poco o ningún progreso, a veces durante décadas.

Probar 44 de 492 conjeturas abiertas de OEIS, aproximadamente el 9%, demuestra que el sistema puede operar en una variedad de dominios matemáticos en lugar de estar especializado de forma estrecha.

AlphaProof Nexus se basa en el trabajo previo de DeepMind con AlphaProof, que logró un rendimiento de nivel medalla de plata en la Olimpiada Internacional de Matemáticas de 2024. El salto de un solucionador de olimpiadas a un demostrador de nivel de investigación es significativo: los problemas de olimpiadas están diseñados para ser resolubles en cuestión de horas por humanos talentosos, mientras que los problemas de investigación abiertos no tienen tal garantía.

Qué significa esto para la verificación de IA y cripto

AlphaProof Nexus no tiene conexión directa con criptomonedas, activos digitales o tokens. DeepMind lo desarrolló para investigación matemática, con aplicaciones previstas en combinatoria, geometría algebraica y optimización.

La tecnología principal, la verificación formal impulsada por IA, se encuentra en la intersección de varios problemas que interesan a la industria cripto. La auditoría de contratos inteligentes, la generación de pruebas de conocimiento cero y la verificación de protocolos criptográficos dependen todos de la misma capacidad fundamental: garantizar que las declaraciones lógicas sean demostrablemente correctas.

La verificación formal es el proceso de probar matemáticamente que un software se comporta como se pretende. Históricamente, ha sido costoso y lento, requiriendo experiencia humana especializada. Un sistema que puede generar y validar automáticamente pruebas formales por unos pocos cientos de dólares por problema cambia la economía de esta ecuación.

Las pruebas de conocimiento cero, la técnica criptográfica que sustenta las cadenas de bloques centradas en la privacidad y las soluciones de escalado de capa 2, requieren una construcción matemática rigurosa. Los errores en el diseño del circuito ZK pueden comprometer tanto la privacidad como la seguridad.