ディープマインドCEOでAlphaGoの生みの親であるデミス・ハサビスは、ゲームを用いたAI研究を10年以上にわたり続けてきた。
今回は、彼がAIを23年間運営されてきた「生きた宇宙」、つまり新手ガイドですらプレイヤーを退屈させる太空オンラインゲームEVE Onlineに投入した。
棋には終局があるが、EVEにはない。
5月初、DeepMindは、EVE Onlineと研究提携を発表しました。その理由は単純です。EVEの複雑でプレイヤー主導の宇宙は、AIの記憶、継続的な学習、長期的計画をテストするための完璧な安全なサンドボックスだからです。

DeepMindがEVEと提携するのは、面白いゲーム体験を追求したり、ゲームプレイを強化するためではなく、現在のAIエージェント研究で最も難解とされる3つの課題に取り組むためである。Hassabisは、23年運営されてきたこの古いゲームに答えを賭けた。

Fenris Creations(元CCP Games)がDeepMindと提携すると発表
EVE Onlineの開発元は、5月6日に同日、4つの発表を行った:
- 親会社であるPearl Abyss体系から再独立;
- Fenris Creationsに名称変更;
- 1億2千万ドルの取引を完了;
- Googleは今回の独立の一部として、Fenris Creationsの少数株式を保有し、同時にGoogle DeepMindとの研究協力を開始しました。
Fenris CreationsのCEOであるヒルマル・ベイガー・ペテュルソンは、公告で述べた:
今回の移行にはレイオフや再編は含まれず、チーム、製品、開発計画は変更ありません。EVEは継続します。
運営データから見ると、この会社は資産を売って生き延びようとするのではなく、本物の弾薬を持って協力を提案しています。
EVE Onlineは2025年に7000万ドル以上の収益を上げ、11月には過去最高の収益を記録し、第4四半期はこのゲーム20年史上で2番目に高い収益を記録した。
Fenris Creationsが独立したことで、EVEはより大きなゲーム配信会社の戦略目標に縛られることなく、研究協力の方向性を自ら決定できる母体を得ました。

1997年、Fenrisが発売したボードゲーム製品ボックス。「Fenris」という名前はEVE Onlineより6年前から存在しており、Fenris Creationsへの名称変更は新規開始ではなく、過去への遡及である。
DeepMindはなぜEVEを選んだのか?
2023年「人造社会」
AIベンチマークは再現が難しい
「ゲーム+AI研究」と聞いて、多くの人がまず思い浮かべるのはAlphaGoやAlphaStarですが、EVEはそれらとは異なります。
囲碁とスターレフトには共通点がある:一局の試合には開始と終了があり、明確な勝敗ルールが存在する。
AlphaGoの目標は碁の勝利であり、AlphaStarの目標はスターレフトの勝利であり、どちらも「単一局面の知能」の研究パラダイムであるが、EVEには最終局面はない。
EVE Onlineは「単一共有宇宙」(single-shard / single shared universe)で知られ、多数のプレイヤーが同じ永続的な世界で長期間にわたり競争し、取引し、同盟を結び、戦争を繰り広げています。
プレイヤーはここで実際の経済システム、政治同盟、軍事グループ、貿易路線、歴史的な因縁、そして数年にわたる戦争計画を築き上げました。
ある戦いは、準備から終結まで整整一年を要する。ある同盟の台頭と滅亡は、後のプレイヤーによって真実の歴史として研究される。
ヒルマーは公告で、「EVEは、既に現実世界のように動作する環境で知的課題を探索できる数少ない場所の一つです。」と述べました。
ハサビスはさらに、幼少期からゲームをプレイし、キャリアの出発点はAIシミュレーションゲームの設計であり、AlphaGo、AlphaStar、SIMAの研究はすべてゲームと深く結びついており、EVEが次の段階の選択であると語った。
プレイヤーによって構築され、その複雑さが比類ない宇宙で、新しいゲーム体験を安全に探索し、AI研究を推進するために、Fenris Creationsと協力できることを嬉しく思います。
ほとんどのAIベンチマークは健康診断のようなものだが、EVEはAIをすでに23年間続いている「人工社会」に放り込むようなものだ。
エージェント3つの最も難しい課題
ちょうどEVEプレイヤーの日常です
今回、公式により3つの研究分野が明確に示されました:長距離計画(long-horizon planning)、メモリー(memory)、継続的学習(continual learning)。
この3つの方向は、現在のAIエージェント研究分野で広く認められている最も難しい3つの課題です。
もしあなたの周りにEVE Onlineを10年以上プレイしている人がいれば、アカウントを開いて友達リストを見てもらえば、おそらく数十のグループと数百の名前が表示され、メモ欄には「2018年のDelveキャンペーンで借りた債務」「鵞群連合(Goonswarm)内部の裏切り者、協力しないで」「この男はスパイで、組織全員が知っている」などと書かれている可能性が高い。
これはコンテキストウィンドウではなく、セッションを越えた10年分の長期記憶です。
この試練を記憶することは、EVEプレイヤーが毎日乗り越えていることだ。継続的な学習という試練も同じだ。
2014年1月、B-R5RB戦闘は約21時間にわたり、7500人以上のキャラクターが参加し、75隻のタイタンが破壊され、損失は実質的な通貨に換算して約30万ドルに達した。この戦闘の引き金となったのは、主権請求書の自動支払いが失敗したことだった。
この戦いが終わると、ゲーム全体の艦隊戦術が一新された。以降数年間、各同盟の艦隊構成と戦術体系は、この戦いの検証を基に継続的に進化した。毎月更新され、毎回の敗北は実行可能な戦略更新に分解された。
長期計画に関しては、EVE連盟戦争の標準的な時間単位は時間ではなく、月である。星域をまたぐ戦争は、準備から開戦まで、造船、輸送、外交、潜入、反間策など、数百人のプレイヤーがタスクの指示なしに自発的に協力し、月を越えて共通の目標を推進する。
この協力体制は、23年間にわたりプレイヤー自体が育み出したものです。
現在のAIエージェント評価で最も難しいとされる3つの課題は、ちょうどEVEプレイヤーの日常である。
EVEにおける23年のプレイヤー主導の進化は、常に変化し、常に複雑で、近道のない環境を生み出した。このような複雑さは、実験室では人工的に合成できない。
DeepMindが2025年11月にリリースしたSIMA 2は、「指示の実行」から「目標の理解、推論プロセス、プレイしながら学習」へと進化しました。
研究の観点から見ると、EVEプロジェクトはSIMA 2と同じく「ゲームをエージェントの訓練場とする」路線に属しており、異なるのは今回の訓練場が23年間継続して動作する現実の宇宙である点です。

EVE Onlineのゲーム内キャンペーン画面上で、プレイヤー自発的に組織され、数時間にわたる大規模な戦闘が繰り広げられるのは、DeepMindがEVEを長期計画と継続的学習の研究対象として選んだ主な理由である。
DeepMindはオフラインサンドボックスに導入されています
プレイヤーユニバースではありません
DeepMindのFenrisとの今回の協力方式は、予想以上に保守的で、DeepMindが得たのは、現役プレイヤーの本番サーバーへの直接アクセス権限ではない。
DeepMindは公式公告で、初期研究はEVE Onlineのオフラインバージョンを用いて、ローカルサーバー上で制御された環境でモデルをテストおよび評価し、EVE Onlineの本番サーバーには接続しないと明言しました。
一方で、オフライン版ではDeepMindが現役プレイヤーの対戦データを利用せず、実際のサーバー経済にも干渉しないため、プライバシーおよびコンプライアンス上の複雑さを回避できます。
一方、オフライン版EVEは、複雑なルールシステム、艦船と経済メカニズム、星域構造などのコアデザインを維持できます。
DeepMindが得たのは、23年のプレイヤーによるストレステストを経た複雑な世界であり、エージェントが生き残るための試験場である。
アタリからEVEへ
この道はどこへ向かっていますか
DeepMindのこの十数年の訓練場を振り返ると、明確な進化の流れが見られる。
2013年から2015年まで、Atariがスタート地点だった。DQNはエージェントを《ブロック崩し》や《スペースインベーダー》のような明確なステージと閉じたルールを持つゲームに配置した。反応と価値推定が試された。
2016年から2017年にかけて、AlphaGoとAlphaZero。囲碁のルールは整然としており、行動空間は広大だが閉じられている。探索と長距離推論が問われる。
2019年、AlphaStarは《スタークラフト2》に参戦した。初めてリアルタイム、不完全情報、マルチラインゲームの環境に挑んだ。部分的観察下でのリアルタイム意思決定が試された。
2024年、SIMAは複数のゲームにまたがる汎用エージェントを目指し、移転汎化を検討した。
2025年、SIMA 2のアップグレード:指示を実行するだけでなく、ユーザーと対話し、目標を推論し、ゲーム中に自己改善します。

DeepMindが2025年にリリースしたSIMA 2は、「指示の実行」から「目標の理解、推論プロセス、プレイしながら学習」へと進化しました。
各世代の環境は、前世代よりも「現実世界の姿」が少しずつ増えていきます:ルールが閉じているから開かれ、完全情報から不完全情報へ、単一の対戦から対戦間の移行へ。
しかし、これまでこれらの環境はほとんどが相対的に閉鎖的で、分割可能で再評価可能なタスクの場であった。たとえばAtariは固定ルールのアーケードゲームであり、AlphaStarは一局ずつ終了するスターケフト対戦に直面し、SIMAは複数の3D仮想環境でゲーム間の汎化をテストした。
EVEの特徴は、長期にわたり運営され、プレイヤーによって駆動され、経済的・政治的構造が継続的に進化するパーシステントワールドであることです。
それは23年間にわたり、オープンなルールの世界で真のプレイヤーたちによって自発的に進化してきたものである:完全なプレイヤードリブン経済(ISKの価格変動は実際の金融市場に匹敵)、クロスアライアンスの政治構造(外交、スパイ活動、休戦協定)、小規模な衝突から21時間に及ぶ大戦までの一連の戦争エコシステム。
業界内でのエージェント評価に関する合意がますます明確になっており、単一タスクのスコアリングはもはや新しい手立てを生み出せないが、長期記憶、週をまたぐ計画、失敗からの学習については、まだ適切な評価環境が存在しない。
したがって、DeepMindが今回選んだのは、新たな合成環境を再構築するのではなく、人類のプレイヤーが23年間にわたりストレステストを施してきた「人工社会」に足を踏み入れることです。
しかし、より大きな問題も浮上しました:
EVE内で継続的に存在し、学習し、計画を立てるAIエージェントと、現実世界で自律的に動作するエージェントとの間には、何が足りないのか?
参考資料:
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
本文は微信公众号「新智元」より、著者:ASI启示録、編集:元宇
