DeepMind s'associe à EVE Online pour tester l'IA dans un univers virtuel âgé de 23 ans

icon MarsBit
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Actualités IA + crypto : DeepMind, le laboratoire de recherche en IA à l'origine d'AlphaGo, a annoncé un partenariat avec EVE Online, un jeu multijoueur spatial âgé de 23 ans. Cette collaboration testera la planification et l'apprentissage à long terme de l'IA dans un univers piloté par les joueurs. Le jeu, désormais géré par Fenris Creations, génère plus de 70 millions de dollars par an. Les recherches initiales utiliseront une version hors ligne pour éviter de perturber les données des joueurs en direct ou l'économie.

Le PDG de DeepMind et père d'AlphaGo, Demis Hassabis, utilise des jeux pour la recherche en IA depuis plus de dix ans.

Cette fois-ci, il a lancé l'IA dans un « univers vivant » qui existe depuis 23 ans : un jeu de simulation spatiale en ligne, EVE Online, dont le tutoriel pour débutants suffit à décourager les joueurs.

Les échecs ont une fin, EVE n'en a pas.

Au début mai, DeepMind a annoncé un partenariat de recherche avec EVE Online, car l'univers complexe et piloté par les joueurs de EVE constitue un sandbox sécurisé idéal pour tester la mémoire, l'apprentissage continu et la planification à long terme de l'IA.

DeepMind

DeepMind s'associe à EVE, non pas pour offrir une expérience de jeu amusante ou enrichir la mécanique de jeu, mais pour aborder les trois défis les plus difficiles et largement reconnus dans la recherche actuelle sur les agents d'IA. Hassabis mise tout sur un jeu ancien de 23 ans.

DeepMind

Fenris Creations (anciennement CCP Games) annonce un partenariat avec DeepMind

L'entreprise derrière EVE Online a annoncé quatre choses le même jour, le 6 mai :

  • Réintégration indépendante du groupe mère Pearl Abyss ;
  • Nom changé en Fenris Creations ;
  • Effectuer une transaction de 120 millions de dollars ;
  • Dans le cadre de cette indépendance, Google détient une participation minoritaire dans Fenris Creations et lance simultanément une collaboration de recherche avec Google DeepMind.

Le PDG de Fenris Creations, Hilmar Veigar Pétursson, a déclaré dans l'annonce :

Cette transition ne implique aucune suppression d'emplois ni restructuration ; l'équipe, le produit et les plans de développement restent inchangés. EVE continue.

Du point de vue des indicateurs opérationnels, cette entreprise vient négocier des partenariats avec des « ressources réelles », et non pour vendre ses actifs afin de survivre.

EVE Online a généré plus de 70 millions de dollars de revenus en 2025, avec un record historique de revenus en novembre, et le Q4 est devenu le deuxième trimestre le plus rentable de l'histoire du jeu, sur 20 ans.

La séparation de Fenris Creations permet à EVE d'avoir une maison mère autonome capable de décider librement de ses collaborations de recherche, sans être liée aux objectifs stratégiques d'un éditeur de jeux plus vaste.

DeepMind

Boîte de jeu de société publiée par Fenris en 1997. Le nom « Fenris » précède EVE Online de six ans ; le changement de nom en Fenris Creations est un retour en arrière, pas un nouveau départ.

Pourquoi DeepMind a-t-il choisi EVE ?

2023 « Société artificielle »

Les tests de référence IA sont difficiles à reproduire

Beaucoup de personnes, en entendant « jeu + recherche sur l'IA », pensent immédiatement à AlphaGo ou AlphaStar, mais EVE est différent de ces derniers.

Le go et StarCraft partagent une caractéristique commune : une partie a un début, une fin et des règles claires pour déterminer le gagnant.

L'objectif d'AlphaGo est de gagner une partie d'échecs, celui d'AlphaStar est de remporter une bataille de StarCraft, tous deux s'inscrivent dans le paradigme de l'intelligence « single-game », mais EVE n'a pas de fin.

EVE Online est connue pour son « univers partagé unique » (single-shard / single shared universe), où de nombreux joueurs rivalisent, échangent, forment des alliances et se livrent à la guerre dans un même monde persistant.

Les joueurs ont établi ici des systèmes économiques réels, des alliances politiques, des groupes militaires, des routes commerciales, des rancunes historiques et des plans de guerre s'étendant sur plusieurs années.

Certaines campagnes prennent une année entière depuis leur préparation jusqu'à leur conclusion. La montée et la chute de certaines alliances sont étudiées par les joueurs ultérieurs comme de l'histoire réelle.

Hilmar a déclaré dans l'annonce : « EVE est l'un des rares endroits où l'on peut explorer des problèmes intelligents dans un environnement qui fonctionne déjà comme le monde réel. »

Hassabis a également mentionné qu'il jouait à des jeux depuis son enfance, que son parcours professionnel a commencé par la conception de jeux d'IA simulés, et que les recherches sur AlphaGo, AlphaStar et SIMA sont profondément liées aux jeux, tandis que EVE constitue le choix pour la prochaine étape :

Je suis ravi de collaborer avec Fenris Creations pour explorer en toute sécurité de nouvelles expériences de jeu et avancer la recherche sur l’IA dans un univers créé par les joueurs, d’une complexité inégalée.

La plupart des benchmarks d'IA ressemblent à un examen médical, tandis qu'EVE ressemble plutôt à jeter l'IA dans une « société artificielle » qui dure depuis 23 ans.

Les trois os les plus durs pour l'agent

C'est exactement la routine des joueurs EVE

Cette fois, l'officiel a clairement listé trois domaines de recherche : la planification à long terme (long-horizon planning), la mémoire (memory) et l'apprentissage continu (continual learning).

Ces trois domaines sont considérés comme les trois défis les plus difficiles dans le domaine de la recherche sur les agents d'IA actuels.

Si quelqu’un autour de vous joue à EVE Online depuis plus de dix ans, demandez-lui d’ouvrir son compte et de vous montrer sa liste d’amis : vous verrez probablement des dizaines de groupes et des centaines de noms, avec des notes comme « dette de la campagne Delve en 2018 », « traître au sein de Goonswarm, ne pas coopérer », ou « ce type est un espion, tout le monde dans l’organisation le sait ».

Ce n'est pas une fenêtre de contexte, mais une mémoire à long terme inter-sessions avec une base de dix ans.

Ce niveau de mémoire, les joueurs EVE le traversent quotidiennement, tout comme le niveau d'apprentissage continu.

En janvier 2014, la bataille de B-R5RB a duré environ 21 heures, impliquant plus de 7 500 personnages, avec 75 Titan détruits et des pertes équivalentes à environ 300 000 dollars américains en monnaie réelle. Le déclencheur de cette bataille a été un paiement de facture souveraine non automatique.

Après cette bataille, toute la tactique flottante du jeu a été réécrite. Les configurations de flottes et les systèmes tactiques de tous les alliances ont été itérés pendant les années suivantes, avec des mises à jour mensuelles, chaque défaite décomposée en stratégies exécutables.

En ce qui concerne la planification à long terme, l'unité de temps standard pour les guerres d'alliances EVE n'est pas l'heure, mais le mois. Une guerre interstellaire, de sa préparation à son déclenchement, implique la construction de navires, le transport, la diplomatie, la dissimulation, le contre-espionnage — des centaines de joueurs collaborent spontanément sans aucune planification de tâches, avançant sur plusieurs mois vers un objectif commun.

Ce système de collaboration a émergé naturellement des joueurs au cours des 23 dernières années.

Les trois os les plus durs dans l'évaluation actuelle des agents IA sont précisément la routine des joueurs EVE.

L'évolution pilotée par les joueurs dans EVE en 2023 a créé un environnement en constante mutation, toujours complexe, sans raccourci, que aucun laboratoire ne peut synthétiser artificiellement.

SIMA 2, publié par DeepMind en novembre 2025, est passé de « l'exécution d'instructions » à la « compréhension des objectifs, au raisonnement et à l'apprentissage en jouant ».

Du point de vue de la recherche, le projet EVE et SIMA 2 appartiennent tous deux à la lignée « jeux comme terrains d'entraînement pour les agents », la différence étant que cette fois, le terrain est un univers réel en fonctionnement depuis 23 ans.

DeepMind

Scènes de campagnes dans EVE Online, ces batailles à grande échelle, spontanément organisées par les joueurs et pouvant durer plusieurs heures, constituent la raison fondamentale pour laquelle DeepMind a choisi EVE comme contexte d'étude pour la planification à long terme et l'apprentissage continu.

DeepMind entre dans un sandbox hors ligne

Pas l'univers des joueurs

La manière dont DeepMind collabore avec Fenris est plus conservatrice que prévu ; DeepMind n'a pas obtenu l'accès direct aux serveurs officiels des joueurs actifs.

DeepMind a déclaré dans son annonce que la recherche initiale sera menée sur une version hors ligne d'EVE Online, en utilisant des serveurs locaux pour tester et évaluer les modèles dans un environnement contrôlé, sans connexion aux serveurs en production d'EVE Online.

D'un côté, la version hors ligne signifie que DeepMind n'utilisera pas les données de combat des joueurs en ligne ni ne perturbera l'économie du serveur réel, évitant ainsi toute complexité en matière de confidentialité et de conformité.

D'autre part, la version hors ligne d'EVE conserve toujours les mécanismes centraux tels que le système de règles complexe, les vaisseaux et l'économie, ainsi que la structure des régions spatiales.

DeepMind reçoit un monde complexe « testé par des joueurs depuis 23 ans », un examen où l'agent doit survivre.

De Atari à EVE

Où mène ce chemin ?

En regardant en arrière depuis les années de formation de DeepMind, on observe une ligne d'évolution très claire.

De 2013 à 2015, Atari était le point de départ. DQN plaçait l'agent dans des jeux à niveaux bien définis et à règles fermées, comme Breakout et Space Invaders, testant la réactivité et l'estimation de la valeur.

De 2016 à 2017, AlphaGo et AlphaZero. Les règles du go sont régulières, l'espace d'actions est vaste mais fermé. Cela teste la recherche et le raisonnement en chaîne longue.

En 2019, AlphaStar a intégré StarCraft II. Pour la première fois, dans un environnement en temps réel, à information incomplète et à jeux multi-lignes. Il s'agissait d'évaluer la prise de décision en temps réel sous observation partielle.

En 2024, SIMA vise à créer un agent universel fonctionnant sur plusieurs jeux, en se basant sur la transférabilité et la généralisation.

En 2025, mise à jour SIMA 2 : non seulement elle exécute les commandes, mais elle peut aussi dialoguer avec les utilisateurs, raisonner sur les objectifs et s'améliorer en cours de jeu.

DeepMind

SIMA 2, publié par DeepMind en 2025, est passé de « l'exécution d'instructions » à « la compréhension des objectifs, le raisonnement et l'apprentissage en jouant ».

Chaque génération d'environnement intègre davantage de caractéristiques du monde réel : de la fermeture des règles à leur ouverture, de l'information parfaite à l'information imparfaite, de l'affrontement unique à la transférabilité entre parties.

Mais auparavant, ces environnements étaient pour la plupart des domaines de tâches relativement fermés, découpables et évaluables de manière répétée : par exemple, Atari proposait des jeux d'arcade à règles fixes, AlphaStar affrontait des parties individuelles de StarCraft, et SIMA testait la généralisation interjeux dans plusieurs environnements virtuels 3D.

Ce qui distingue EVE, c'est qu'il s'agit d'un monde persistant où l'économie et la structure politique évoluent continuellement, pilotées par les joueurs.

Il s'est développé de manière spontanée au cours de 23 ans, par un groupe de joueurs réels dans un monde régi par des règles ouvertes : une économie entièrement pilotée par les joueurs (les fluctuations des prix ISK sont comparables à celles des marchés financiers réels), des structures politiques inter-alliances (diplomatie, espionnage, accords de cessez-le-feu), et un écosystème de guerre complet, allant des conflits à petite échelle jusqu'à des batailles de 21 heures.

La communauté commence à atteindre un consensus plus clair sur l'évaluation des agents : les performances sur des tâches ponctuelles n'apportent plus de nouvelles perspectives, mais l'évaluation de la mémoire à long terme, de la planification sur plusieurs semaines et de l'apprentissage à partir des échecs n'a toujours pas de cadre d'évaluation adéquat.

Ainsi, le choix de DeepMind cette fois-ci est : plutôt que de créer un nouvel environnement synthétique, entrer dans une « société artificielle » déjà testée pendant 23 ans par des joueurs humains.

Mais une question plus importante surgit alors :

Qu'est-ce qui manque encore à un agent d'intelligence artificielle capable d'exister, d'apprendre et de planifier en continu dans EVE, par rapport à un agent autonome opérant dans le monde réel ?

Références :

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

Cet article provient du compte officiel WeChat « Nouvelle Intelligence », auteur : Apocalypses de l'ASI, éditeur : Yuan Yu

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.