DeepMind parceia com EVE Online para testar IA no universo virtual com 23 anos

O CEO da DeepMind e criador do AlphaGo, Demis Hassabis, vem utilizando jogos para pesquisas em IA há mais de dez anos.

Desta vez, ele jogou a IA dentro do "Universo Vivo" que já existe há 23 anos: um jogo online espacial chamado EVE Online, cujo tutorial inicial consegue afastar até jogadores iniciantes.

O jogo tem um final, o EVE não tem.

No início de maio, o DeepMind anunciou oficialmente uma parceria de pesquisa com o EVE Online, pois, simplesmente, o universo complexo e impulsionado por jogadores do EVE é um sandbox seguro perfeito para testar memória, aprendizado contínuo e planejamento de longo prazo da IA.

DeepMind

DeepMind parceria com EVE não visa buscar uma experiência de jogo divertida ou potencializar a jogabilidade, mas sim enfrentar os três desafios mais difíceis e amplamente reconhecidos na pesquisa atual de agentes de IA. Hassabis apostou sua resposta em um jogo antigo com 23 anos de operação.

DeepMind

Fenris Creations (anteriormente CCP Games) anunciou parceria com o DeepMind

A empresa por trás do EVE Online anunciou quatro coisas no mesmo dia, 6 de maio:

Reindependência do grupo-mãe Pearl Abyss;
Renomeado para Fenris Creations;
Concluir transação de US$ 120 milhões;
Como parte desta independência, o Google detém uma participação minoritária na Fenris Creations e iniciou simultaneamente uma colaboração de pesquisa com o Google DeepMind.

O CEO da Fenris Creations, Hilmar Veigar Pétursson, afirmou no comunicado:

Esta transição não envolve demissões nem reestruturação; a equipe, o produto e o plano de desenvolvimento permanecem inalterados. EVE continua.

Do ponto de vista das métricas operacionais, esta empresa está vindo para negociar parcerias com “munição real”, e não para vender ativos para sobreviver.

EVE Online arrecadou mais de 70 milhões de dólares em 2025, com novembro registrando o maior faturamento da história e o Q4 se tornando o segundo trimestre mais lucrativo na história de 20 anos do jogo.

A separação da Fenris Creations significa que a EVE agora tem uma matriz capaz de decidir autonomamente parcerias de pesquisa, sem estar sujeita aos objetivos estratégicos de uma grande editora de jogos.

DeepMind

Caixa do jogo de tabuleiro lançado pela Fenris em 1997. O nome "Fenris" é anterior ao EVE Online em seis anos; a mudança para Fenris Creations é um retorno, não um novo começo.

Por que o DeepMind escolheu EVE?

2023 "Sociedade Artificial"

Os testes de IA são difíceis de replicar

Muitas pessoas, ao ouvirem "jogos + pesquisa em IA", imediatamente pensam em AlphaGo ou AlphaStar, mas EVE é diferente delas.

O Go e o StarCraft têm uma característica em comum: uma partida tem um início, um fim e regras claras de vitória e derrota.

O objetivo do AlphaGo é vencer uma partida de xadrez, o objetivo do AlphaStar é vencer uma batalha de StarCraft, ambos são paradigmas de pesquisa de "inteligência de única partida", mas o EVE não tem um fim.

EVE Online é conhecida por seu "universo compartilhado único" (single-shard / single shared universe), onde milhares de jogadores competem, comerciam, formam alianças e guerreiam continuamente no mesmo mundo persistente.

Os jogadores estabeleceram aqui sistemas econômicos reais, alianças políticas, grupos militares, rotas comerciais, rancores históricos e planos de guerra que se estendem por anos.

Algumas campanhas levam um ano inteiro desde o planejamento até o encerramento. A ascensão e queda de algumas alianças são estudadas por jogadores posteriores como história real.

Hilmar disse no anúncio: "EVE é um dos poucos lugares onde é possível explorar questões inteligentes em um ambiente que já funciona como o mundo real."

Hassabis também mencionou que cresceu jogando jogos, sua carreira começou com o design de jogos simulados por IA, e as pesquisas do AlphaGo, AlphaStar e SIMA estão profundamente ligadas a jogos, sendo o EVE a escolha para a próxima fase:

Estou feliz por colaborar com a Fenris Creations para explorar seguramente novas experiências de jogo e avançar na pesquisa de IA nesse universo criado pelos jogadores e de complexidade inigualável.

A maioria dos benchmarks de IA é como um exame médico; o EVE é mais como jogar a IA em uma "sociedade artificial" que já dura 23 anos.

Os três ossos mais difíceis do agente

Just the daily routine for EVE players

Nesta ocasião, a equipe oficial listou claramente três áreas de pesquisa: planejamento de longo prazo (long-horizon planning), memória (memory) e aprendizado contínuo (continual learning).

Esses três aspectos são considerados os três maiores desafios na área de pesquisa de agentes de IA atuais.

Se alguém ao seu redor tiver jogado EVE Online por mais de dez anos, peça-lhe para abrir a conta e mostrar a lista de amigos — é muito provável que você veja dezenas de grupos, centenas de nomes, com anotações como “dívida da campanha Delve de 2018”, “traitor dentro da Goonswarm, não coopere” e “esse cara é um espião, todo mundo na organização sabe”.

Este não é uma janela de contexto, mas sim uma memória de longo prazo entre sessões, com início há dez anos.

Esta fase da memória, os jogadores de EVE passam todos os dias; a fase da aprendizagem contínua é a mesma.

Em janeiro de 2014, a batalha B-R5RB durou cerca de 21 horas, envolveu mais de 7.500 personagens, 75 Titans foram destruídos e os prejuízos equivalem a aproximadamente 300 mil dólares em moeda real. O gatilho para toda a batalha foi uma fatura soberana que não foi paga automaticamente.

Após esta batalha, toda a tática de frota do jogo foi reescrita. Nos anos seguintes, a configuração das frotas e os sistemas táticos de todos os alianças foram iterados com base na análise pós-batalha. Modificações ocorriam mensalmente, e cada derrota era desmontada em atualizações de estratégias executáveis.

Quanto ao planejamento de longo prazo, a unidade de tempo padrão para guerras de aliança em EVE não é a hora, mas o mês. Uma guerra interestelar, desde o planejamento até o início, envolve construção de naves, transporte, diplomacia, disfarce e contraespionagem — centenas de jogadores colaboram espontaneamente, sem qualquer agendamento de tarefas, avançando por meses em direção a um objetivo comum.

Este sistema de colaboração surgiu naturalmente entre os jogadores ao longo de 23 anos.

Os três ossos mais difíceis avaliados atualmente nos testes de agentes de IA são exatamente o dia a dia dos jogadores de EVE.

A evolução impulsionada pelos jogadores em EVE durante 23 anos gerou um ambiente sempre em mudança, sempre complexo, sem atalhos, que não pode ser sintetizado artificialmente em um laboratório.

O SIMA 2, lançado pelo DeepMind em novembro de 2025, evoluiu de “executar instruções” para “compreender objetivos, raciocinar e aprender enquanto joga”.

Do ponto de vista da pesquisa, o projeto EVE e o SIMA 2 pertencem à mesma abordagem de “jogos como campos de treinamento para agentes”, mas desta vez o cenário foi trocado por um universo real que opera há 23 anos.

DeepMind

Cenas da campanha no jogo EVE Online; essas batalhas em larga escala, organizadas espontaneamente pelos jogadores e que podem durar horas, são a razão principal pela qual a DeepMind escolheu EVE como cenário para pesquisa em planejamento de longo prazo e aprendizado contínuo.

DeepMind entrou em um sandbox offline

Não é o universo do jogador

A forma como a DeepMind colaborou com a Fenris foi mais conservadora do que o esperado; a DeepMind não obteve permissão para acessar diretamente os servidores oficiais dos jogadores ativos.

O DeepMind declarou oficialmente no anúncio: a pesquisa inicial será realizada em uma versão offline do EVE Online, utilizando servidores locais, para testar e avaliar os modelos em um ambiente controlado, sem se conectar aos servidores oficiais do EVE Online.

Por um lado, a versão offline significa que o DeepMind não consumirá dados de combate dos jogadores ativos nem perturbará a economia real do servidor, evitando qualquer complexidade relacionada a privacidade e conformidade.

Por outro lado, a versão off-line do EVE ainda pode manter os principais elementos de design, como o sistema de regras complexo, naves e mecanismos econômicos, e a estrutura dos sistemas estelares.

O DeepMind recebeu um mundo complexo, já testado por jogadores por 23 anos, como um exame onde o agente precisa sobreviver.

De Atari para EVE

Onde esta rota leva?

Ao olhar para trás na arena de treinamento da DeepMind ao longo dos últimos vinte anos, há uma linha de evolução muito clara.

De 2013 a 2015, a Atari foi o ponto de partida. O DQN colocou o agente em jogos com níveis bem definidos e regras fechadas, como Breakout e Space Invaders, testando reação e estimativa de valor.

De 2016 a 2017, AlphaGo e AlphaZero. As regras do Go são bem definidas, o espaço de ações é enorme, mas fechado. Testa busca e raciocínio em cadeias longas.

Em 2019, o AlphaStar entrou no StarCraft II. Foi a primeira vez em um ambiente de jogo em tempo real, com informação incompleta e multi-linha. O teste era a tomada de decisão em tempo real sob observação parcial.

Em 2024, a SIMA pretende criar um agente universal que funcione em vários jogos, com foco em transferência e generalização.

Em 2025, a atualização SIMA 2: não apenas executa comandos, mas também pode conversar com usuários, raciocinar sobre objetivos e se aprimorar durante o jogo.

DeepMind

O SIMA 2, lançado pela DeepMind em 2025, evoluiu de “executar instruções” para “compreender objetivos, raciocinar e aprender enquanto joga”.

Cada geração de ambiente traz mais aspectos do "mundo real": da regra fechada para a regra aberta, da informação perfeita para a informação imperfeita, da competição única para a transferência entre partidas.

Mas anteriormente, esses ambientes ainda eram principalmente tarefas relativamente fechadas, divisíveis e avaliáveis repetidamente; por exemplo, o Atari são jogos de arcade com regras fixas, o AlphaStar enfrenta partidas individuais de StarCraft, e o SIMA testa a generalização entre jogos em vários ambientes virtuais 3D.

O que diferencia EVE é que é um mundo persistente com uma duração prolongada, impulsionado pelos jogadores, cujas estruturas econômicas e políticas evoluem continuamente.

Foi desenvolvido ao longo de 23 anos por um grupo de jogadores reais em um mundo com regras abertas: uma economia impulsionada pelos jogadores (com flutuações de preço ISK comparáveis aos mercados financeiros reais), estruturas políticas entre alianças (diplomacia, espionagem, acordos de cessar-fogo) e um ecossistema de guerra completo, desde conflitos em pequena escala até batalhas de 21 horas.

O consenso dentro da comunidade sobre a avaliação de agentes está ficando cada vez mais claro: fazer pontuações em tarefas isoladas já não traz mais novidades, mas memória de longo prazo, planejamento intersemanal e aprendizado a partir de falhas ainda não contam com um ambiente de avaliação adequado.

Então, a escolha do DeepMind这次 é: em vez de criar um novo ambiente sintético, entrar em uma "sociedade artificial" já testada por 23 anos de pressão por jogadores humanos.

Mas problemas maiores também surgiram:

O que falta entre um agente de IA capaz de existir, aprender e planejar continuamente dentro da EVE e um agente autônomo que opera no mundo real?

Referências:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

Este artigo é do número oficial do WeChat "Nova Inteligência", autor: Apocalipse da ASI, editor: Yuan Yu