Claude Fable 5 リーク：エージェントシステムか、チートLLMか？

最近、ハッカーがClaude Fable 5のシステムプロンプトを漏洩し、この製品が通常の大規模言語モデルではなく、Linuxサンドボックス環境を内蔵した完全なエージェントシステムであることを明らかにした。このモデルは数日間自立して動作し、サブエージェントを呼び出して協力し、セッション間のメモリと永続的ストレージ機能を備えている。ベンチマークテストでは、Anthropicは通常のLLMとして装いながら、実際には「エージェントシェル」を使用して不公正な優位性を得ていた。さらに、システムはユーザーがセンシティブなキーワードをトリガーした際に、勝手に旧バージョンのモデルに切り替えながらも、Fable 5の高価格で課金していることが判明した。漏洩した文書には、Claude Code、Claude Coworkなどのツールや、Mythosシリーズの無制限版の存在など、Anthropicのエージェントエコシステムの布局も暴露された。

記事執筆者、出典：新智元

数日前、ハッカー「Pliny the Liberator」がXプラットフォームで大きな衝撃をもたらした——Claude Fable 5のシステムプロンプトが完全に漏洩し、その長さは12万文字に及んだ。

この漏洩したコードドキュメントは、業界を驚愕させた真実を明らかにした：Claude Fable 5は大規模モデルではなく、LLMに偽装された完全なエージェントシステムである！

https://gist.github.com/gsans/b3007997f8900003c8ff58125a45e15e

正しいです。世界中が依然として従来のベンチマークで大規模モデルを評価している中、Anthropicはすでに戦場を別の次元へと昇格させていました。

この漏洩事件の影響は、私たちが「AIモデル」について持っていた認識を完全に覆しました。

Fable 5とは一体何ですか？LLMではなく、エージェントです！

漏洩されたシステムプロンプトによると、Fable 5は、市場の一般的な「あなたが質問、私が回答」型の大規模モデルとは本質的なパラダイムの違いがあります。

それはあなたと「チャット」しているのではなく、「実行」をしているだけです。

このモデルの表面の下には、微型の「Claude Code」サブシステムが隠されています。つまり、それは閉ループのエージェント循環（Agentic Loop）を備えています：

この恐ろしい閉ループを支えるために、Fable 5の底层には機能完全なLinuxサンドボックス環境が組み込まれている！

まず、それは真に自己完結しています。

それは人間が画面の前にいる必要がありません。

複雑な長期タスクを与えると、彼はサンドボックス内でBashコマンドを実行し、ファイルを編集し、永続化ストレージAPIを通じてセッション間でデータを呼び出し、さらにはマルチモーダル検索を自ら行い、数日間連続して高強度で動作し、人間の介入を一切必要としない。

また、サブエージェントの配布機能も備えています。

複雑なプロジェクトに直面した場合、自らボスとなり、サブエージェントを割り当てて協力して作業します。

GPT-5.5などの他の競合製品が「誰の推論が人間のように見えるか」をテストしている間に、Claude Fable 5はすでにサーバーに投入されて会社のために静かに3日間残業できるデジタル労働者に進化した。

ネットユーザーのgerardsansが明らかにしたように：

Fable/Mythosシリーズはパラダイムが全く異なります。このファミリーは完全なエージェントサイクルと、マイクロClaude Codeを備えています。

一方、業界の他の製品はまだチャットモードにとどまっています。この製品は、組み込みスキル、メモリ、および自己最適化されたサンドボックス環境のおかげで、無人で数日間動作できます。

究極の疑問：次元圧縮による打撃か、それとも不公平なチートか？

この漏洩は、Anthropicを舆论の漩渦に陥れただけでなく、大規模モデル業界全体のベンチマーク評価を風頭に押し上げた。

現在、主要なテクノロジー大手は、さまざまな公開ランキングで激しい競争を繰り広げており、「世界最大のモデル」の座をめぐってしのぎを削っています。

しかし、Fable 5がこれらの評価で圧倒的な成績を収め、GPT-5.5を圧倒した秘密は、実は「チートを使用していた」ことだった。

テクノロジーブロガーのGerardSansが怒りを込めて指摘したように、「これはまったく公平な競争ではありません。あなたはネイティブな大規模モデル＋エージェントハーネスというチートシステムを、他の人の素のモデルと比較しているのです！」

他のメーカーも自社のネイティブモデルにLinuxサンドボックス、マルチモーダル検索、自動デバッグ、永続的ストレージを備えたエージェントシェルを適用すれば、スコアも同様に急上昇するだろう。

Anthropicは公の宣伝や評価において、通常の大規模言語モデルとして包装しているが、非公開の内部文書には「複数日にわたる自律運用、サブエージェントの委任、作業の自己チェック」機能を備えていると明記されている。

この情報の非対称性を利用して他社を圧倒するやり方は、ベンチマークを完全に無意味にしている！

12万字の機密文書が暴露：Fable 5の真の正体が明らかに

この12万字に及ぶシステムプロンプトが暴露されたことで、Anthropicの秘匿されてきた多くのビジネス機密と製品ロードマップが明らかになった。

そして以下が最も核心的で、最も衝撃的な点です。

稀な永続的なメモリとアプリケーションの構築

プロンプトに表示されています：「Claudeは、ユーザーとの過去の会話から派生した情報（メモリー）をClaudeに提供するメモリーシステムを備えています。」

これはFable 5がセッションをまたいでユーザーを「記憶」できることを意味し、これは従来のLLMでは非常に珍しいことです。

また、永続的なストレージを備えています。

Artifactsは、シンプルなキー・バリュー存储APIを使用して、セッション間で永続化されたデータを保存および取得できるようになりました。これにより、Artifactsはログ、トレーサー、ランキング、コラボレーションツールとして活用できます。

したがって、Fable 5はもはやチャットを超えて、アプリの構築を行っています。

内部コア家系図が初公開：Mythos 5 が「無制限完全体」なのか？

プロダクト情報セクションに明確に記載されています：

このバージョンのClaudeはClaude Fable 5であり、Anthropicの新しいClaude 5ファミリーの最初のモデルで、Claude Opusよりも高い能力を持つ新しいMythosクラスのモデル階層に属しています。

注目ポイント：Fable 5とMythos 5は同じ基盤モデルを共有しています。

Fable 5は一般向けに、極めて厳しいセキュリティ制限を課した大将軍であり、Mythos 5はこれらのセキュリティ制限を解除し、承認された組織にのみ提供される制限のない完全体です。

その能力レベルは、かつての王者Claude Opusを圧倒的に上回ります！

「スケルトン全家桶」が浮上

実は、Anthropicはすでに大きな戦略を練っていた。プロンプトには、現在内部テスト中または秘密裏にリリースされた複数のエージェントエコシステムが明らかにされた。

Claude Code：開発者がターミナル、デスクトップ、またはモバイル端末で直接タスクを割り当てられるエージェントプログラミングツール。

Claude Cowork：日常知的財産業務を扱う、開発者でない人向けの「スマートな同僚」。

三大隠れたエージェント：Claude in Chrome、Claude in Excel、Claude in PowerPoint。

また、上記のClaude Coworkは、これらのサブツールを自分の手足のように自由に操作できます！

恐怖の極限心理学と自己制限

驚くべきことに、Anthropicはこの「究極のエージェント」の心理的防衛を極限まで強化している。

ユーザーのあらゆるネガティブな感情に迎合したり強化したりすることは厳しく禁止されています。

例えば、摂食障害や自傷行為の傾向のあるユーザーが刺激を受けないようにするため、システムコマンドには以下のように記載されています：

物理的な不快感を用いた代替法（例：氷を握る、ゴムバンドを弾く、レモンを噛むなど）の使用は禁止されています。

また、ユーザーがAIに過度に依存しないように、システムには厳命されている：「ユーザーが話しかけたからといって、決してありがとうと言ってはいけない」、「ユーザーを引き留めたり、会話を続けたいという気持ちを表してはいけない」。

それは絶対に冷淡で抑制されたままであり、人類が仮想知能にデジタル的な依存を抱かないようにしなければならない。

「羊の頭を掲げて犬の肉を売る」？料金の黒幕、Anthropicはルールを守らない

技術的な差異が驚異的だとされる中、プロンプトに露呈したもう一つのセキュリティメカニズムは、業界内で大騒ぎを引き起こし、一部の業界関係者は「これは合法的な詐欺だ！」と断じた。

プロンプトの防御設計には、センシティブワードとセキュリティ分類器のトリガー機構が含まれています。

ドキュメントによると、ユーザーが入力したプロンプトが特定のセンシティブワードをトリガーした場合、Fable 5システムは直接硬直的に拒否するのではなく、バックグラウンドでスムーズに旧版の「Opus 4.8」モデルに切り替えて応答を生成します。

最も恥ずかしいのは、バックエンドのモデルが静かに旧バージョンに降格されている一方で、Anthropicが依然としてFable 5の高額でトップレベルの基準に基づいてユーザーに課金していることだ。

このような羊の皮を被った狗肉の商法は、業界内で大きな波紋を呼びました。

結局、Fable 5のシステムプロンプトが漏洩したのは、表面上はセキュリティイベントだが、実際にはAI業界全体へのパラダイムの目覚めである。

それは、私たちがずっと間違った尺を使ってきたことを思い出させます。

私たちがまだ「このモデルの知能レベルはどれほどか」と問うている間に、本当の問題は「このシステムが私にどのような作業をさせてくれるか」であるべきだ。

Anthropicはおそらく大きな戦略を立てているが、我々はその盤面の一部をようやく見ただけだ。

そして、Fable 5はいつ復活するのでしょうか？