Anthropic、Fable 5をリリース。MythsモデルがAGIに近づく

皆さんは4月にAnthropicがMythosというモデルをリリースしたことを覚えていると思います。

名前からどれほど凄いかわかる、神話だ。

当時、50社の企業クライアントに対して1万以上の深刻な脆弱性が特定され、業界全体に衝撃を与えました。

このニュースは、ネットセキュリティ株を一斉に下落させ、皆さんの記憶にも新しいはずです。

あまりに強力であるため、悪用される恐れがあり、「危険すぎて公開できない」として、一般には開放されていません。

昨日の夜までに、AnthropicはMythosモデルにセキュリティ分類器を追加し、Fable 5を正式にリリースしました。

未改訂版のMythos 5は、現在、ホワイトハウス、ネットセキュリティ防御者、透翅蝶計画など、厳格な審査を通過した約200の機関にのみ開放されています。

このような慎重さは、最近話題のAIアニメ『エンジェルエンジン』を連想せずにはいられない。

檻の中に閉じ込められているのは、その「天使」ですか？

今はそうでなくても、もう間もなくです。

01

Anthropic公式が公開したテストデータおよび最初の企業パートナーからの実測報告によると、Fable 5の強力さは「嘆為観止」と表現できます。

まずランニングスコアをご覧ください。

自動プログラミング評価ランキングSWE-Bench Proにおいて、Claude Fable 5の通過率は80.3％、その「母」となるOpus 4.8は69.2％；GPT-5.5は58.6％；Gemini 3.1 Proはわずか54.2％です。

最先端のコード評価において、Fable 5は29.3％、Opus 4.8は13.4％；GPT-5.5はわずか5.7％。

……

その差は、冷兵器時代にいきなり機関銃が現れたようなものである。

その他の分野、ソフトウェア工学、独立した科学的仮説、薬物分子設計、モデル蒸留と極限圧縮、長文理解など、すべてのテストでFable 5は常に第1位でした。

具体的な内容は、動画をご覧ください。

実戦をもう一度見ましょう。

決済大手のStripeは、Fable 5を用いて早期テストを実施しました。彼らは5000万行に及ぶレガシーコードベースの全体系移行を必要としており、この規模のリファクタリングは専門チームに委託しても最低2か月はかかると評価されています。

結果、タスクをFable 5に与えると、それは自ら計画を立て、進捗を確認し、エラーが発生した場合は自ら修正した。たった1日で、5000万行のコード移行が完了した。

このような表現は、「強大」の二文字で済ませられるものではありません。

狭義の観点から見ると、Fable 5はすでにデジタル経済レベルでのAGIを実現している。

その理由は、真の「長期代理能力」を示しているからです。

GPT-5.5であろうとGemini 3.5であろうと、それより劣る他の大規模モデルであっても、本質的には「応答」しているにすぎない。

一脚踹下去，它走一步。

行き止まりに遭遇した場合、それは例外を投げて、「ごめんなさい、私はただの言語モデルです」と言います。

ツールとは言え、ユーザーは依然として深く考え、AIを段階的に導いて望む結果を得る必要があり、簡単ではありません。

内面化された目標指向のロジックを備えたFable 5は異なります。

Stripのテストのように、ユーザーが難易度の高い長期タスクを提示し、三段階で進める：

サブタスクツリーを構築する；

異なるツール（ウェブ検索、データベース取得、Pythonサンドボックス環境）をスケジュールする；

自己を振り返り、道が不通だと気づいたら、すぐに別の道を進む。

人はタスクを提示し、成果を受け取るだけで、それ以上指図する必要はありません。

この製品は生産性ツールとして非常に完璧です。

しかし、それは本物のAGIとはまったく別物です。

Fable 5の強さは、そのコードベースや科学文献などに依然として存在する基礎的な数学的ロジックと構造的定義に築かれている。

これは、長大なテキストの注意メカニズムの劣化という課題を克服したため、数百万トークンに及ぶ複雑なタスクにおいても、コア目標とのアラインメントを常に維持できるからです。

しかし、それを完全に混沌としており、デジタルルールが欠如し、人間自身もまだ理解できていない物理的現実社会の泥沼に投げ込むと、依然として「基盤の欠如」により論理的な断絶が生じる。

OpenAIが提唱する「人工知能の5段階基準」（レベル1：チャットボット；レベル2：推論者；レベル3：エージェント；レベル4：革新者；レベル5：組織）で測定した場合。

Opus 4.8はレベル2からレベル3へ進む段階であり、Fable 5はレベル3にしっかりと定着し、レベル4への探求を開始しました。

一方、Opus 4.7から4.8までは43日かかりましたが、4.8からFable 5まではたった11日でした。

4級に到達するにはどのくらいかかりますか？Anthropicの更新頻度がますます速まっていることを考えると、今年中に実現する可能性が高いです。

最終の5段階であっても、楽観的な見通しで18〜24ヶ月しかかからないため、本当に一歩手前です。

この速度は速すぎます。これがセキュリティ制限を設ける最大の理由です。

02

Anthropicがモデルと同時に公開した《System Card》およびRSP評価報告書において、Mythos 5は2つの能力で極めて危険なシグナルを示した。

まず、Fable/Mythosのベースモデルは、化学および生物学の評価においてCB-1レベルに達しています。

つまり、このモデルは「新規ではない生物・化学兵器の合成と製造を指示する」エンドツーエンドの能力を備えており、特定の高危険ウイルスの伝播効率を最適化するための遺伝子配列の変更提案さえ提供している。

大学本科レベルの生物学の知識を持つテロリストが、封印が解除されたMythos 5を手に入れれば、モデルに繰り返しヒントを提供することで、原料の監督回避方法、地下に簡易P3ラボを構築する方法、高致死性病原体を合成する方法に関する完全なガイドを得ることができる。

第二に、ネットワーク攻撃と脆弱性の悪用。

極初期のテストで、Mythos 5は電力プラント、金融決済システム、病院ネットワークシステムなどの重要なインフラの核心的な脆弱性を自ら発見し、攻撃する能力を示し、数秒でターゲットに特化したゼロデイ脆弱性攻撃スクリプトを生成できた。

今年4月、Mythosが開発された直後に、50社の初期パートナーに対して1万以上の深刻な脆弱性が発見されたとのリークがあった。

……

この二つの状況において、Mythos 5を一般大衆に直接投入するのは、リスクが高すぎます。

この猛獣を檻に入れなければならない。

2か月ぶりに、Anthropicが開発したケージは2階建てです。

第一に、サイレントデグラデーションルーティングメカニズム。

Anthropicは、Fable 5のフロントエンドに、完全に独立し、非常に迅速な高精度分類器AIを導入しました。

ユーザーがネットワーク攻防、生物化学、またはモデル重みを引き出そうとする複雑な隠されたプロンプトを入力した場合、分類器は即座にアラートを発し、バックグラウンドで静かにセッションを古いOpus 4.8にルーティングして対応します。

第二に、データの保持。

Anthropicとアマゾンは昨夜、第一方および第三者プラットフォームを問わず、Mythosモデルへのすべてのトラフィックに対して、30日間のデータ保持を強制することを発表しました。

なぜですか？

真のハッカーやテロリストは、ほとんどの場合知能が高く、直接「爆弾の作り方を教えてください」と尋ねることなく、問題を100の無害に見える基本的な質問に分解する。

30日間の完全データ監視は、パターン認識を通じて、単一の会話では見抜けない「ソーセージ切り」のような悪意のある乱用を捕捉することを目的としています。

ダリオ・アモデイは以前、公の場で次のように警告していた。「AIが人間にとって災害的なリスクをもたらす確率は、実に25％である。」

Anthropicは、社内規定の「責任あるスケーリング方針」（RSP）および「フロントラインコンプライアンスフレームワーク」（FCF）に準拠するため、この巨大な存在に鍵をかけなければならない。

そこで、Fable 5が生まれました。

03

改めて価格について話しましょう。

Anthropicが発表した公式価格は、入力トークン100万トークンあたり10ドル、出力トークン100万トークンあたり50ドルです。

高すぎます。

現在のエンタープライズレベルのエージェントタスクは、高精度を追求するために「複数回の思考、さらに思考、さらに思考」というチェーン論理を採用しており、1回の処理で2000万の入力トークンを消費し、500万の修正済みコードを出力する。

計算すると、1回のタスクで450ドルかかります。

また、Anthropicは通知を発表し、現在の個人サブスクリプション（Claude Pro）に含まれるMythosモデルの体験ウィンドウは、2026年6月22日に完全に終了すると述べています。

今後、個人ユーザーが実際にそれを仕事に使うと、数十ドルはあっという間に使い果たしてしまうだろう。

技術の進化により、最終的には価格が下がるでしょうが、その頃にはもはや最強ではなくなっているでしょう。

現在の状況は明確です：最先端の大規模モデルは高級品となり、一般の人々には手が届きません。

B2B市場に焦点を当てるAnthropicにとって、これは当然である。

問題は、前不久、グーグルがまだ価格戦争を積極的に発表していたことである。

競合他社が次々と価格を引き下げて市場を奪い合っている中で、なぜAnthropicは逆に価格を引き上げることができるのか？

トークンの価格は仮想的なものであり、リターン率が本質である。

企業クライアントは、1kWhや1トークンの価格など気にせず、AIが一連のエンジニアリングプロセスを完璧にバグなく実行できれば、そのプレミアムを争って支払う。

より重要なのは、今日のサイバーセキュリティ戦争が、すでにAIとAIの間の対立に彻底していることである。

Fable/Mythosレベルのモデルがシステムの脆弱性を瞬時に見つけ出すため、企業や国家機関が攻撃から守るための唯一の選択肢は、Anthropicに高額でMythos 5の社内専用防御サービスを購入することである。

要言すれば、保護料を徴収しているようなものだ：私は最も恐ろしい剣（Mythos 5）を生み出し、人が傷つかないように鞘をつけて一般に販売した（Fable 5）。しかし、同時に制限のない剣を防衛部門に販売し、彼らに他の人々が開発中の剣を阻止させるようにしている。

AIの脅威に対する防御は、すべての大企業にとって必須の支出となる。

これにより、B端市場の高額予算はAnthropicに集中し、公文書の作成やメール送信にしか使えない安価なモデルは、利益が極めて低いC端市場で激しい競争を繰り広げることになる。

今後、世界のサイバーセキュリティセクターはAIによって駆動される価値の再評価を迎えることが予想されます。

一方で、「一人企業」もまもなくますます一般的な現象となるでしょう。

04

独自のタスク予算配分機能を備え、メモリ作業とコンテキスト管理をサポートし、人間のように記憶し、見直し、やり直すことができ、要件ドキュメントからコード納品までのライフサイクル全体を独立して担うことができます……

Fable 5とMythos 5の登場は、大規模モデル技術の更新というより、AI産業の分業が完全に成熟した成人式である。

AI市場は、ようやく「全員無料体験」の田園時代を脱した。

最高峰の計算能力と最も深遠な知性は、商業的価値を最も効果的に生み出すインフラ、研究、B2Bアプリケーションの分野に、戦略的生産資源として優先的に供給される。

これは生産性の爆発的な拡大の祭典であり、労働市場の冬の時代でもある。

本文は微信公众号「グロン」より、著者：万連山