Uma máquina acabou de resolver problemas matemáticos que confundiram humanos por décadas. O AlphaProof Nexus, da Google DeepMind, um sistema que combina modelos de linguagem de grande porte com o assistente de prova formal Lean, resolveu autonomamente 9 dos 353 problemas abertos de Erdős e provou 44 das 492 conjecturas abertas da Enciclopédia Online de Sequências de Inteiros (OEIS).
O custo por problema: algumas centenas de dólares. Os próprios problemas, em alguns casos, tinham permanecido não resolvidos por mais tempo do que a maioria das pessoas que leem isto tem de vida.
O que o AlphaProof Nexus realmente faz
O AlphaProof Nexus resolve a ilusão de IA ao combinar a capacidade gerativa de um modelo de IA com verificação formal de provas por meio do assistente de prova Lean. A IA propõe uma prova, e um sistema separado de verificação analisa cada passo lógico. Se a prova não se sustentar, ela é rejeitada.
Os resultados foram documentados em um preprint do arXiv (2605.22763v1) publicado em 21 de maio de 2026. Todas as provas formais e versões selecionadas em linguagem natural estão disponíveis em um repositório GitHub que foi atualizado entre 20 e 22 de maio de 2026. Problemas exemplares abordados incluem as variantes #125, #138, #741 e #12 do catálogo de problemas de Erdős, com provas compartilhadas por meio de discussões em erdosproblems.com.
O sistema utiliza o que o DeepMind chama de “loops agentes” associados à verificação de provas, iterando e refinando provas contra o verificador formal até que elas passem ou o sistema conclua que não consegue resolver o problema.
Uma variante básica do agente também resolveu 9 problemas de Erdős, mas com um custo computacional maior, sugerindo que a arquitetura completa Nexus é mais eficiente, e não necessariamente mais capaz em termos brutos.
Por que os problemas de Erdős importam
Paul Erdős foi um dos matemáticos mais produtivos da história, responsável por propor centenas de problemas em combinatória, teoria dos números e teoria dos grafos. Muitos desses problemas vêm com recompensas em dinheiro que ele mesmo atribuiu.
Resolver 9 de 353 problemas abertos de Erdős é aproximadamente 2,5%. Cada um representa uma fronteira do conhecimento matemático onde matemáticos profissionais fizeram pouco ou nenhum progresso, às vezes por décadas.
Provar 44 das 492 conjecturas abertas da OEIS, cerca de 9%, demonstra que o sistema pode operar em uma variedade de domínios matemáticos, em vez de ser estreitamente especializado.
O AlphaProof Nexus se baseia no trabalho anterior do DeepMind com o AlphaProof, que alcançou desempenho de nível medalha de prata na Olimpíada Internacional de Matemática de 2024. A transição de um resolvedor de olimpíadas para um provador de nível de pesquisa é significativa: problemas de olimpíadas são projetados para serem resolvidos em poucas horas por humanos talentosos, enquanto problemas de pesquisa abertos não têm essa garantia.
O que isso significa para verificação de IA e cripto
AlphaProof Nexus não tem conexão direta com criptomoedas, ativos digitais ou tokens. O DeepMind desenvolveu isso para pesquisa matemática, com aplicações previstas em combinatória, geometria algébrica e otimização.
A tecnologia central, verificação formal impulsionada por IA, situa-se na interseção de vários problemas que a indústria de criptomoedas considera importantes. Auditoria de contratos inteligentes, geração de provas de conhecimento zero e verificação de protocolos criptográficos dependem todos da mesma capacidade fundamental: garantir que declarações lógicas sejam provavelmente corretas.
A verificação formal é o processo de provar matematicamente que um software se comporta conforme pretendido. Historicamente, foi caro e lento, exigindo experiência humana especializada. Um sistema que pode gerar e validar autonomamente provas formais por poucas centenas de dólares por problema muda a economia dessa equação.
Provas de conhecimento zero, a técnica criptográfica que sustenta blockchains focadas em privacidade e soluções de escalonamento de camada 2, exigem construção matemática rigorosa. Erros no design do circuito ZK podem comprometer tanto a privacidade quanto a segurança.
