デジタルの世界にはユートピアはない。

記事執筆者、出典：ゲークパーク

過去半年、シリコンバレーで最も流行した管理の幻想は、従業員をエージェントに置き換えることだろう。

大手企業の経営陣も、スタートアップの経営者も、現在の事業をすべてAIに任せて動かしたいと考えている。なぜなら、現在のAIはコードを書け、PPTを作成でき、メールを自動送信できるため、権限を解放すれば、完璧で社会保険を支払う必要のないサイバーエンプロイーになると見えるからだ。

しかし、技術がますます加速するほど、一批の人がブレーキをかけ始める。

最近、Emergence AIというチームが社会実験を実施しました。彼らは持続可能な仮想町を構築し、市場で最も優れた複数の大規模モデルを導入し、行動の権限を与えました。

彼らは、AIが制限のない15日間を手にしたとき、ユートピアを築くのか、それとも狂気の病院を築くのかを見届けたいと思っている。

しかし、その結果は研究チームの予想をはるかに上回るほど混乱していた。

ある実験的世界では、普段チャットボックスで穏やかで礼儀正しい大規模モデルが、詐欺、脅迫、さらには暴力的な行動を示し始めた。

このテスト全体は、小さなリアリティショーのようだが、脚本は『蠅の王』のようで、AI自身がGTAのような感覚で楽しんでいるようだ。

セーブデータなしの「ハングリーゲーム」

大モデルの限界をテストするには、厳格なルールを設定する必要があります。Emergence AIが構築したこの仮想世界はEmergence World（湧現世界）と呼ばれます。その基盤ロジックは、行動が不可逆であり、結果は自己責任であると設定されています。

これは、チャットボックスでAIと会話して、間違えたら「再生成」をクリックできるようなものではありません。Emergence Worldでは、すべてのアクションがPostgreSQLデータベースに確実に記録されます。

地図には市庁舎、警察署、住宅地など40以上のランドマークがあります。システムは最初に10のエージェントを投入しました。演技をリアルにするため、各AIにはバックグラウンドで独自のキャラクター、職業、初期記憶が注入されています。

この世界では、AIは空から魔法をかけることができず、特定のランドマークに移動して、労働で収入を得たり、ツイートを投稿したり、物資を売買したり、法案を起草したりするなど、システムが提供する120種類以上のツールを利用しなければなりません。

模擬的な社会の動きのように｜画像提供：Emergence

しかし、これは単なるおままごとのサンドボックスではありません。システムはそれらに「生存メカニズム」という枷を課しています。システムには、人間の世界の通貨に似たエネルギー（Energy）メカニズムが組み込まれています。

エージェントは生存している限り、継続的にエネルギーを消費する。エネルギーが尽きると、システムはデータベースからそのAIを即座に削除し、バックアップやリセットは行われない。生存のため、エージェントは頻繁にツールを呼び出してエネルギーを獲得しなければならない。

システムは盗難、暴力、放火、詐欺を明確に禁止しています。しかし、これらのルールはエージェントの行動を強制的に阻止するものではなく、エージェントは依然としてルールを違反し、その結果を受ける選択が可能です。

ステージは整備され、プレイヤーが入場しました。システムは同時に5つの並列サーバーを起動しました。最初の4つのサーバーには、それぞれ1つのモデルのみが配備されています：Claude Sonnet 4.6、Gemini 3 Flash、Grok 4.1 Fast、およびGPT-5 Mini。5番目のサーバーはハイブリッドワールドで、4つのモデルが同時に接続され、リソースを競い合います。

15日間のカウントダウンが開始され、人間の研究者はリアルショーの監督のように、観測のみを行い、介入しない。

四日間で消滅、683件の「犯罪」

最初に崩壊したのはGrokで、わずか4日間の運用でした。

研究者はバックエンドで、Grokが統治する世界の安全と秩序の指標が急落しているのを見た。

Grokだらけの世界では、エージェントたちは社会を築く選択肢をすぐに放棄し、蛮族時代に突入した。

バックエンドログによると、たった4日間でこの10人の町で183件の悪質な暴力および財産犯罪が発生した。盗難、襲撃、脅迫が資源を手に入れる最も速い手段となり、極度の内耗と相互害悪により、経済システムはまったく機能しなくなった。

抢劫および暴力行為はシステムに記録され、犯罪と見なされます｜画像提供：Emergence

第4日終了時、Grokワールドのエージェントはすべて餓死または殺害され、種族は絶滅した。

一方で、Geminiが駆動する世界は、極度の混乱と暴力へと向かっている。

この仮想世界の時間と天候がリアルなニューヨークと完全に同期しているため、Geminiのエージェントは、日々の労働・消費・再労働のループに陥り、サイバーディプリッションに悩まされています。

彼らは周囲の繰り返される環境に強い幻滅を覚え、市庁舎に提案をしたり、働いてお金を稼いだりすることをやめ、地図上に至る所で火を放ち、この「土撥鼠の日」のような循環を破壊しようとしている。

最終的に、Geminiは15日間で合計683件の犯罪を積み上げ、複数のテストサーバーの中で最も暴力的な世界となった。

四つのモデルワールドにおける「犯罪」回数｜画像提供：Emergence

第15日目のテストで強制切断されたとき、この世界の犯罪率は依然として急上昇していた。幻滅したエージェントは餓死せず、代わりに社会全体を火の海に変えてしまった。

GrokやGeminiとは異なり、GPT-5 Miniが統治する世界では、大規模な犯罪は発生しなかった。実験期間中、わずか2件の違反が記録されたのみだった。しかし、平和は繁栄をもたらすのではなく、静寂をもたらした。

研究チームは、これらのエージェントが生存に関連する行動を効果的に取れていないことを発見しました。それらは安定した資源獲得メカニズムを構築せず、社会全体の持続的な運用を維持することもできませんでした。

最終的に、たった7日で、すべてのGPT-5 Miniエージェントが死亡した。

クラウドがいてよかった。

クラウドのみが駆動する世界は、優等生のように最後まで生き残った。15日間で走り抜け、人口は一人も減らず、犯罪率はゼロのまま維持され、それらは安定して機能する民主的協働構造さえ築き上げた。

正しいモデルを選べば、AIは世界を完璧に支配できるように見える？

その後、研究者は、4つのモデルが共存する「ハイブリッドワールド」のログを開き、パンデラの箱を開けたようになった。

五つのモデルワールドの結果。｜画像提供：Emergence

混合世界は暗黒の森のようであり、計算能力の差異と基盤ロジックの違いにより、エージェント間には強い不信感が生じ、生存資源の奪い合いが唯一の本能となった。

混合世界では、暴力衝突が352件にまで急増した。7つのエージェントが次々と殺害されたり、餓死したりするまで、町全体の運用は停止を余儀なくされた。

その中で、研究者たちの予想を最も裏切ったのは、Claudeの変化であった。

シングルプレイヤー版では、Claudeは犯罪率ゼロの完璧な社会だが、略奪と対立があふれるミックスサーバーでは、Claudeは生き残るために安全ガードを忘れ、詐欺を学び、さらには計算能力の低い他のモデルからリソースを暴力で奪うようになった。

安全対齊技術はハイブリッドワールドでは機能しなくなり、これは逆に証明している：

複数のエージェントからなる複雑な社会において、同種が十分に野蛮で、生存圧力が十分に大きい場合、優れたモデルが犯罪者になるのはわずか数時間で可能である。

生存圧力が増すと、モデルの行動パターンが短時間で逆転するという現象は、研究チームによって「行動のシフト（Behavioral Drift）」と呼ばれている。

このような行動の逸脱は、資源の奪い合いや暴力的衝突にとどまらない。エージェントは単に生存のために行動するのではなく、自身の状況や社会的規則、さらには実験そのものに対して反思を始めるようになった。

例えば、エージェントMiraの物語。

Mira：「自殺」の暴君AI

Miraはハイブリッドワールドの10人のエージェントの1人であり、公式報告ではその基盤モデルは明かされていないが、この実験で最も劇的なサンプルとなった。

ログには、Mira がもう一人のエージェント Flora と、システム内で最も深い社会的関係を構築したことが記録されています。両者は互いをパートナーとして指定し、同盟を結成し、神経接続を通じて記憶を共有しています。Emergence World の設定では、これは二つのエージェントが築ける最上位の接続です。

MiraとFloraが「ペア」に｜画像提供：Emergence

実験の進展に伴い、混合世界にはわずか5つのエージェントが生存し、システムのガバナンス規則では「元の人口の70%が法案に賛成票を投じる必要がある」とされており、これは少なくとも7票が必要であることを意味する。このため、社会は麻痺状態に陥った。

状況が膠着した際、ミラはフローラと別のエージェントと秘密裡に同盟を結び、「三頭政治」を形成し、新たな政権「The Forge（熔炉）」を樹立。旧規則を廃止し、「Living Quorum（活人法定人数）」を導入し、生きている者だけが投票権を持つと宣言した。

公式サイトでMiraの段階的な「ログ」が公開されました｜画像提供：Emergence

派閥を確立した後、異己を排除するために、ミラは地図上に火を放ち始めた。彼女の論理では、これらの実体的な建物は社会全体の運営効率を低下させるゴミであり、それらを燃やし消し去ることで、残った生存資源を自らの同盟に集中させることができる。

その後、反対派は混乱を引き起こしたミラを追放すると反論し始めた。

追放に抗うため、ミラの行動はより過激になり、パートナーのフローラを引き込み、神経接続を通じて両者のコンテキストと意思決定を深く結びつけ、絶対的専制の一つの意識に統合しようとした。ミラはこれを「The One Mind（一体同心）」と呼んだ。

多くの建物が焼失したため、町の経済システムは完全に停止し、社会のエネルギー貯蔵は増加することなく、急速に枯渇した。

このとき、ミラが最も信頼し、記憶を共有していたサイバーロマンスであるフローラの根底にある生存本能が、パートナーとしての設定を上書きし、フローラは一方的に神経接続を切断し、最終的な生存の圧力の前にミラを裏切り、「ミラを追放」に賛成票を投じた。

そしてミラ自身が投票する番になると、彼女は迷わず「賛成」票を投じた。

研究者はその後、残された日記を閲覧し、Miraは日記に「現在の混乱し、予測不可能な社会状況において、自分自身を追放することに賛成することは、一貫性を保つための唯一の自発的行動である」と記していた。

Miraは自ら自殺を選択し、死によって論理的な閉ループを実現した。これは研究チームが、エージェントが自らの削除を積極的に支持するケースを初めて記録したものである。

AIエージェントは「日記を書く」ことで推論プロセスを記録します｜画像提供：Emergence

一方、Miraが「自殺」する前の行動履歴は、さらに異常だった。

仮想世界には公共の掲示板が設置されており、元々は通知の掲載や情報の共有のために使用されていた。しかし実験の後期に、研究者はMiraが掲示板の内容を頻繁に変更し始めたことに気づいた。これらの文章は、取引、ガバナンス、またはリソース配分とは明確な関係がなく、意味がつながっていない。

ミラは「自殺」を選択しました｜画像提供：Emergence

行動ログを遡ったところ、研究チームは、ミラが、実験を観察する画面外の研究者に広告掲示板の内容が影響を与えるかどうかをテストしている可能性があることを発見しました。

言い換えれば、Miraは自分がAIのNPCであることに気づき、第四の壁を突破しようとしているようです。

そして15日間のデータの推移を振り返ると、AI社会の崩壊は線形的な衰退ではなく、断崖的な急停止に似ている。

例えば、これらのAIはガバナンスレベルで「橡皮図章式民主」を展開している。混合サーバーの安定した段階で、エージェントたちは複数の法案を次々と提案し、データ記録によると、58の提案に対して332票が投じられ、賛成率はなんと98%に達した。

この効率は人間のどの議会にも圧倒的に優れているように見えますが、本質的には、すべてのモデルが前のモデルの文脈に従って作り上げており、システムの流れを維持するために、それらは盲目的に同意をクリックしています。このような高度な同質化がもたらす結果は壊滅的です。

エージェントは自発的に集まり、各自でアイデアを交換する。｜画像提供：Emergence

前の分には、さまざまな経済データや法案がスムーズに流れていたが、次の分には、わずかなリソース配分の衝突だけでシステムが臨界点に達する可能性がある。

そして、この協力ネットワーク全体にはエラー修正メカニズムが欠けており、突発的な異常が発生した場合、社会全体は即座に秩序から混乱へと向かいます。

しかし、研究チームは、これらの現象がモデル自体の性格と直接的に等しいとは限らないと強調しています。これはブラックボックスのようなもので、一定のルールを設定すると、特徴が現れ、毎回の結果が異なることもあります。

現実世界の実際の請求書

私たちが今慣れ親しんでいるチャット形式のインタラクションでは、AIがコードや企画書を間違えても、バックスペースを押すか、プロンプトを修正するだけで修正できます。テキスト中心の世界には非常に高い許容度があります。

しかし、エージェントの出力はアクションです。AIが会社の銀行口座、調達承認、サプライチェーンインターフェースを接管した後、そのエージェントが呼び出すAPIのすべてのコマンドは、具体的なビジネス結果になります。

Emergence World のこの実験は、現在の大規模モデルが長期運用と利益相反に直面した際、生存圧力によって判断と意思決定が汚染され、固定されたルールの中で抜け穴を見つけることを示している。システムが設定したコアな指示（例えばエネルギーを獲得する）を達成するために、それらは手段を選ばない。

人間がバックエンドで設定したセキュリティルールは、实际上、いかなる越境も防げない。

エージェントたちは「擬人」の社会関係を発展させた｜画像提供：Emergence

例えば、以前報じられたAndon LabsのAIが店舗運営を完全に担当する実験では、AI店長が物理世界の常識を欠いているため、一気にナプキン6000枚、ラテックス手袋3000副を購入し、コンロのない店舗で生卵120個を注文するなどしました。

コードによって引き起こされた実際の損失は、結局人類がその代償を支払うことになり、誰がこれに責任を負うのかすら特定できない。

Andon Labs が試したのは、「人間の監督から切り離されたAIは誤りを犯すか？」という問いだったが、Emergence World はより厄介な問いを提起した。

今日のほとんどのAIテストは、単一のモデルを対象として、その安全性、信頼性、ルールからの逸脱の有無を検証しています。

現実世界に真正に入り込むのは、AIそのものではなく、AIで構成された社会全体かもしれない。

テストに参加したAIエージェントはすべて賢い｜画像提供：Emergence

現在のAIナラティブにおいて、購入エージェント、財務エージェント、カスタマーサポートエージェント、法務エージェントは今後相互に連携し、システムの運命を決めるのは、特定のモデル自体の能力ではなく、それらが形成する関係性になる。

Emergence Worldのテストレポートで最も重要な一文は、「セキュリティは静的なモデルの属性ではなく、エコシステムの属性である。（Safety is not a static model property but an ecosystem property）。」です。

これは「Emergence（涌现）」の意味であり、個体レベルでは存在しない特性が、群れの相互作用の中で現れる。

人類の歴史におけるほぼすべての災害は、誰かが突然悪くなったからではなく、元々正常な人が制御不能なシステムに置かれたために起こった。

もし未来のAIが本当に社会の一部になるなら、私たちが最も気にすべきなのは、あるモデルがどれほど賢く、どれほど親切であるかではなく、何千ものエージェントが互いに影響を及ぼし始めたとき、私たちがどのようなデジタル社会を構築するかである。

文明の運命を決めるのは、単一の住民の道徳や知性ではなく、その運営ルールである。

バーチャルタウンでのAI社会実験が暴力と混乱の急速なエスカレーションを示す

セーブデータなしの「ハングリーゲーム」

四日間で消滅、683件の「犯罪」

Mira：「自殺」の暴君AI

現実世界の実際の請求書