Anthropicは、コード作成、推論、脆弱性発見などの能力において既存の最上位モデルClaude Opus 4.6を圧倒する「Mythos」というコード名の強力なAIモデルを発表した。その画期的なセキュリティ脅威能力により、公開リリースは見送られ、代わりにAWS、アップル、マイクロソフトなど12の主要テクノロジー機関およびLinux財団などのオープンソース団体と連携し、Project Glasswingプロジェクトを開始。世界の重要なデジタルインフラのセキュリティ監査と強化に先行して活用されている。
著者:唐韧
出典:火星財經
私は、人類がAIに通常の認識を超える速さで追い越されつつあるのではないかと考えます。
皆さんの現状はわかりませんが、少なくとも私は今やAIなしでは生きていけません。毎日の仕事の少なくとも50%はAIの支援によって完了しています。
そして、この比率は引き続き上昇しています。
同時に、次々と新しいモデルがリリースされる中、私の仕事の効率と品質、そしてトークンへの月間消費額が急速に増加しています。
昨夜、私はAnthropicが自分たち自身でさえ全員に公開する勇気を持てないほど非常に強力なモデルをリリースしたというニュースを見ました。
この新しいモデルの名前は「Mythos」で、中国語に翻訳すると「神話」という意味です。
現在はプレビュー版であるため、公式には「Mythos Preview」と呼ばれています。ただし、今回は「Project Glasswing」というプロジェクトの形でリリースされています。
このプロジェクトについては、後で説明します。

先月、Anthropic の内部文書が偶然漏洩し、その中には Opus よりも更大で強力なモデルが開発中であり、そのコードネームは Mythos であると記載されていた。
その後、Anthropicはこの漏洩を「人的ミス」によるものとし、さらに理由を説明しなかった。
現在、Mythosというコードネームのモデルが正式に発表されました。
公式発表はされたが、まだ公開リリースされていない。つまり、一般ユーザーはまだ利用できない。
理由は明確です。Anthropicは、このモデルが非常に強力であるため、セキュリティメカニズムが整うまで一般に公開するのは適切ではないと考えています。
この文は、一瞬立ち止まって考える価値があります。
通常、AI企業が新モデルを発表すれば、すぐに市場を獲得しようと即座にリリースするところだが、今回はAnthropicの対応が明らかに異常である。
私には、彼らが発したくないのではなく、発する勇気がないように見える。
なぜなら、このMythosというモデルは本当に強力だからです。
まず、公式が発表したテストデータをいくつか見てみましょう。
コーディング能力において、Mythos と現在公開されている最強の Claude Opus 4.6 の間には大きな差があり、さまざまなベンチマークテストで Mythos はほぼ完勝しています。

推理能力において、GPQA Diamond(大学院レベルの科学質問応答)テストでは、94.6% 対 91.3% で Mythos が勝利。
Humanity's Last Exam のツールあり・ツールなしのテストでも、いずれもMythosが圧勝した。

Agentに関連するコンピュータ操作能力において、OSWorld-Verified(自立したコンピュータタスク実行)では、Mythosが79.6%でOpus 4.6の72.7%を上回りました。
各维度上、MythosはOpus 4.6を上回っており、一部では圧倒的な差をつけています。

一部のタスクのパフォーマンスにおいて、差は微小な改善ではなく、大幅な飛躍となっています。たとえば、SWE-bench Multimodalは27.1%から59%へと跳ね上がり、ほぼ2倍に増加しました。
Mythosがソフトウェア世界のセキュリティ防线を突破する能力が非常に強いため、彼らはオンラインに上がることをためらっている。
正直言えば、世界中のすべてのシステムとソフトウェアには脆弱性があり、Mythosは人間を超えるレベルでこれらの脆弱性を発見し攻撃できます。
もしこの能力がハッカーに掌握された場合、世界中のオペレーティングシステムやソフトウェアが被害を受け、特に公共インフラや国家安全保障に深刻な影響が出ます。
Anthropicの公告にこのような一文があり、読んだ後、考えさせられた。

AIモデルのコーディング能力は非常に高い水準に達しており、ソフトウェアの脆弱性を発見し活用する点で、最も熟練した人間を除くすべての人間を上回るほどである。
この文について、もう少し詳しく説明したいです。
私はプログラマー出身なので、ソフトウェアがどのように構築されるか、そして異なる人が書いたコードの違いがどれほど大きいかを理解しています。
また、どのソフトウェアも、その脆弱性がこれまで発見されたことがないとしても、漏斗がないとは言えません。
以前の脆弱性が何十年も静かにシステムに残っていたのは、システムが十分に安全だったからではない。
しかし、脆弱性を見つけるには、非常に高い専門知識、大きな忍耐とエネルギー、そして大量の時間が必要です。
参加する人が少ないため、投資する人はさらに少ない。
この「能力の希少性」は、ソフトウェアセキュリティ全体の暗黙の前提を構成している。AIの介入により、この前提は徐々に揺らぎ始めている。
AIは、ほとんどのトップレベルでない人間の能力を上回る方法で作業でき、これを使って脆弱性を攻撃することも、脆弱性を塞ぐこともできます。
この問題を解決するために、次にAnthropicが取り組んでいるProject Glasswingについて説明します。
簡単に言えば、Mythosの能力を活用して、世界中のインフラシステムのバグを発見するプロジェクトです。
参加機関には、AWS、Apple、Microsoft、Google、NVIDIA、Cisco、Linux財団など、合計12社が含まれます。

この陣容は、クラウドコンピューティング、オペレーティングシステム、チップ、ブラウザ、金融インフラ、サイバーセキュリティ、およびオープンソースエコシステムをカバーしています。
言い換えれば、世界のデジタルインフラの主要な参加者がほぼすべてこのプロジェクトに集まっています。
このプロジェクトの核心的なロジックは1つだけです。防守側がまずこのトップレベルのAIモデルの機能を使用できるようにすることです。
攻撃側が同等のツールを先に手に入れると、窓が開けば閉じるのが難しくなるためです。Anthropicは、研究プレビュー期間中に1億ドルのモデル利用クレジットを提供すると約束しています。
12のコア機関に加え、40以上の重要なソフトウェアインフラを維持する組織も、Mythosを用いて自社システムおよびオープンソースプロジェクトをスキャンするためのアクセス権を取得しました。
また、Anthropicは、ソフトウェア界のインフラであるLinux財団に250万ドル、Apacheソフトウェア財団に150万ドルを寄付しました。
言い換えれば、現在私たちが使用しているさまざまなアプリ、ウェブサイト、システムは、基本的にそれらを基盤として構築されています。
私には、Anthropic が今回のことで良いことをしたように思えます。より強力なモデルをリリースしただけでなく、世界の情報インフラに資金を投じて自社の技術を向上させました。
結局、裸でいるのは誰にも得にならない。
ここでまだMythosの強さが実感できないかもしれません。私は公式原文から3つの具体的な事例を見つけました。これらは数字よりもはるかに説得力があります。

最初に、OpenBSD。
これは広く認知された安全性の高いオペレーティングシステムであり、私たちが使用するAppleのiPhone iOSシステム、Androidシステム、さらには一部の企業や機関の内部システムを含む、多くの重要なインフラで稼働しています。
Mythosは、攻撃者がターゲットマシンに接続するだけでリモートでクラッシュさせることができる、27年間存在していた脆弱性を発見しました。
27年!誰かが気にしているわけではなく、そもそも誰も見つけていないだけだ。
二番目はFFmpegです。
動画を処理する必要があるほとんどのソフトウェアがこれに依存しており、あなたが使用しているさまざまな動画再生ソフトにはほぼ必ずこの技術が組み込まれています。
16年前に書かれた一行のコードに欠陥が隠れており、自動化テストツールは合計500万回以上攻撃を試みたが、一度も見つからなかった。
しかし、Mythosは見つかりました。
三番目はLinuxカーネルです。
これは言うまでもなく、ほぼインターネット全体の基盤であり、最も注意が必要です。
Mythosは複数の個別脆弱性を発見しただけでなく、それらを一つの攻撃チェーンに結びつけました。
通常ユーザー権限から開始し、段階的に権限を昇格させ、最終的にマシン全体の完全な制御を実現する。
Linuxについては、前の2つのケースとは性質がまったく異なります。
脆弱性を見つけることは、分析能力です。
しかし、串の脆弱性は戦略能力です。
多くの製品マネージャーがプロトタイプ図を描き、ドキュメントを書き、データ分析を行うことは、単一のスキルです。しかし、ビジネス、製品、商業をつなげることが戦略的スキルです。
攻撃経路を計画できるモデルは、もはや監査ツールではなく、デジタル環境で能動的に行動するエージェントに近い。
以上の3つの事例において、Anthropicはいずれも発見→報告→修正→公開の手順を取っており、すべて修正済みです。
これを見れば、Mythosがどれほど強力かお分かりいただけるでしょう。まるで、まだ檻から解放されるのをためらわれる猛獣のように、現実世界はまずそれに適応する準備を整える必要があります。
ここでいくつかの観察を述べたいと思います。これが、本当の変化の始まりとなるかもしれません。
まず、ソフトウェア世界のセキュリティ仮定が無効になりつつある。
今日私たちが当たり前のように感じているソフトウェアの安定性は、システム設計が十分に優れているだけではなく、攻撃能力の希少性に大きく依存している。
正直に言えば、ソフトウェアが十分に強力ではないのではなく、人が十分に強くないのです。
脆弱性を発見するにはコストがかかり、攻撃チェーンを構築するには時間がかかり、大規模なスキャンにはリソースが必要です。そのため、多くの技術的負債、古くからのバグ、古いシステムはそのまま放置され、一度も本格的に整理されたことがありません。
製品を開発する際、論理が完結し、問題ないと感じても、それが本当に万事順調だというわけではなく、おそらく私たちの能力の限界に達しただけかもしれません。
Mythosが示す能力は、脆弱性が発見されてから悪用されるまでの時間枠を、過去の数ヶ月から数分に短縮することである。
数分とは何を意味しますか?
パッチのリズムや修正のプロセスが、攻撃の速度に追いつかなくなっていることを意味する。
第二に、オープンソースの世界が最も早く圧力を感じるでしょう。
今日のほとんどの現代ソフトウェアは、多数のオープンソース依存関係に支えられています。普段は見えませんが、一度脆弱性が突かれた場合、業界全体が同時に影響を受けます。
このロジックにあまり詳しくない読者のために、簡単に言うと、私たちが今使っているすべてのソフトウェアは、オープンソースプロジェクトを基盤としており、これらのプロジェクトのソースコードは誰でも見ることができます。
今後、モデルが継続的かつ大規模にオープンソースプロジェクトをスキャンできるようになると、オープンソースコミュニティのメンテナーが直面する圧力のレベルはまったく異なるものになる。
これがAnthropicがLinux財団とApache財団に寄付する理由です。
公益を目的としているのではなく、オープンソースのインフラがAI時代のデジタル世界で最も脆弱であり、かつ絶対に崩れてはならない基盤であることを認めているだけだ。彼らは悪者や悪人と見なされたくはないだけである。
第三に、人間は弱体化し、AI同士が競い合うようになる。
以前のインターネット製品セキュリティチームの価値は、人の判断力、経験の蓄積、およびシステムへの深い理解にあった。
将来、このことは別のロジックに変わるでしょう。
誰のモデルがより強力で、誰のツールがより速く接続でき、誰がAI監査を開発プロセスの最前線に組み込めるかが競われている。
これはプログラマーが置き換えられる問題ではなく、セキュリティ業界自体の生産方式が再編されるということである。
一方では、数千の深刻な脆弱性が数週間以内に見つかる可能性があります。問題は、攻撃者もいずれ同じレベルのツールを手に入れるということです。
そのときには、ソフトウェア製品のセキュリティは人対人の対立ではなく、モデル対モデルの攻防の競争となる。
今回は、Anthropicが能力だけでなく、リスクも公開しました。これは、現在の段階で業界全体が最も必要としているような誠実さかもしれません。
誰もがAIが生産性にどのように影響を与えるかを議論しており、それは間違っていない。
しかしMythosは、AI能力の飛躍が最終的にコンテンツ世界からソフトウェア世界へ、そしてデジタル世界全体のインフラへと伝播すると警告しています。
コンテンツの世界が書き換えられ、トラフィックのロジックに影響を与えます。
ソフトウェアの世界が再構築され、基盤が動いている。
このとき、映画『2012』の一節を思い出しました。これをこの記事の結びとしましょう。
あなたが誰であっても、人種や国を問わず、明日は私たちに違いはありません!
