著者:Anthropic
深潮 TechFlow
深潮ダイジェスト:Anthropicは、未公開の先進モデル「Claude Mythos Preview」をリリースしました。このモデルのコード監査能力は、大多数のヒューマンセキュリティエキスパートを上回り、数十年間存在していたゼロデイ脆弱性を自ら発見できます。
この能力を基に、AnthropicはAWS、アップル、グーグル、マイクロソフト、NVIDIAなど12のテクノロジー大手と連携し、Project Glasswing計画を立ち上げ、1億ドルのクレジット枠を投入。攻撃者が同等の能力を獲得する前に、世界の重要なソフトウェアの脆弱性を修復することを目的としています。
導入
本日、Amazon Web Services(AWS)、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks が参加する新イニシアチブ「Project Glasswing(グラスウィング計画)」を発表します。この計画の目標は、世界で最も重要なソフトウェアのセキュリティを守ることです。
私たちは、Anthropic が訓練した新しいフロントランナーモデルが、ネットセキュリティの構造を再定義する可能性があると判断したため、Project Glasswing を開始しました。Claude Mythos Preview は、汎用的で未リリースのフロントランナーモデルであり、AI モデルのコーディング能力が、最高峰の専門家を除くすべての人々を上回るレベルに達しているという厳しい事実を明らかにしています。
Mythos Preview は、すべての主要なオペレーティングシステムとすべての主要なブラウザにわたる数千の深刻な脆弱性を発見しました。AI の進歩の速度に従い、このような能力は近い将来に広がり、責任感のない利用者に手渡される可能性があります。経済、公共の安全、国家安全保障への影響は非常に深刻になる可能性があります。Project Glasswing は、これらの能力を防御に優先的に活用しようとする緊急の試みです。
Project Glasswingの一環として、上記のパートナーは防御セキュリティ活動にMythos Previewを活用します。Anthropicは得られた知見を共有し、業界全体の利益に貢献します。また、重要なソフトウェアインフラを構築または保守している40以上の組織にもアクセスを開放し、自社システムおよびオープンソースシステムのスキャンと強化を可能にしました。Anthropicは、Mythos Previewの利用枠として最大1億ドルを投入するとともに、オープンソースセキュリティ団体に400万ドルを直接寄付することを約束しています。
Project Glasswing は単なる出発点にすぎません。どの機関も网络安全の問題を単独で解決することはできません。最先端のAI開発者、他のソフトウェア企業、セキュリティ研究者、オープンソースのメンテナー、そして世界中の政府すべてが不可欠な役割を果たします。グローバルなネットワークインフラの防衛には数年かかる可能性がありますが、最先端のAI能力は今後数ヶ月で大幅に進化する可能性があります。ネットワーク防御者が優位に立つには、今すぐ行動する必要があります。
AI時代のサイバーセキュリティ
銀行システムを動かし、医療記録を保存し、物流ネットワークを接続し、電力網を維持する私たちが日々頼りにしているソフトウェアには、常にバグが存在します。ほとんどのバグは重要ではありませんが、中には深刻なセキュリティ上の欠陥があり、発見されると攻撃者がシステムを乗っ取り、運用を麻痺させ、データを盗む可能性があります。
ネットワーク攻撃による企業ネットワーク、医療システム、エネルギーインフラ、交通ハブ、および各国の政府機関への壊滅的影響はすでに明らかである。グローバルレベルでは、中国、イラン、北朝鮮、ロシアからの国家主導の攻撃が、民間生活と軍事準備を支えるインフラを脅かしている。単一の病院や学校を対象とした小規模な攻撃でも、巨額の経済的損失や機密情報の漏洩、さらには生命の危機を引き起こす可能性がある。グローバルなサイバー犯罪による年間経済的損失は正確に算出することは難しいが、約5000億ドルと推定されている。
過去、多くのソフトウェアの欠陥は、それを見つけて悪用するには極めて少数のセキュリティ専門家にしか持たれない専門知識が必要だったため、長年にわたり発見されなかった。しかし、最新のAIモデルの登場により、ソフトウェアの脆弱性を見つけて悪用するためのコスト、労力、専門的ハードルが大幅に低下した。過去一年、AIモデルはコードの読み取りと推論能力を著しく向上させ、特に脆弱性の発見と悪用方法の構築において驚異的な成果を上げている。Claude Mythos Previewは、これらのサイバーセキュリティスキルで飛躍的な進歩を遂げており、数十年にわたり人間によるレビューを受け、数百万回の自動化セキュリティテストを経ても生き残ってきた脆弱性を発見し、開発する悪用コードもますます洗練されている。
最初のDARPAネットワークチャレンジから10年後、最先端のAIモデルは、最高峰の人類の脆弱性発見および悪用能力に近づき、あるいはそれに追いつきつつある。必要なセキュリティ対策がなければ、これらの強力なネットワーク能力は、世界で最も重要なソフトウェアに存在する膨大な脆弱性を悪用するために使用される可能性がある。サイバー攻撃はより頻繁になり、より破壊的になり、米国およびその同盟国の対立国に力を与えることになる。これは民主主義国が重視すべきセキュリティの優先課題である。
良いニュースは、AIモデルを不適切な手に渡したときに危険になる能力が、重要なソフトウェアの欠陥を発見・修正する点で非常に価値があり、セキュリティバグが少ない新しいソフトウェアの開発を支援できるということです。Project Glasswingは、即将到来のAI駆動型サイバーセキュリティ時代において、防御者が持続的な優位性を築くための重要な一歩です。
Claude Mythos Preview は脆弱性とその悪用方法を発見する能力
過去数週間、私たちはClaude Mythos Previewを使用して、すべての主要なオペレーティングシステム、すべての主要なブラウザ、およびその他の重要なソフトウェアにおいて、数千のゼロデイ脆弱性(これまでソフトウェア開発者が完全に知らなかった欠陥)を発見しました。その多くは高リスクレベルです。
Frontier Red Team ブログでは、修正済みの脆弱性の技術的詳細と、Mythos Preview が見つけた攻撃手法の一部を公開しました。これらの脆弱性の発見(および関連する多くの攻撃手法の開発)は、人間のガイドなしでモデルが完全に自律的に実行しました。以下に3つの例を示します:
- Mythos Preview は、OpenBSD で 27 年間存在していた脆弱性を発見しました。OpenBSD は、非常に高いセキュリティ強化レベルで知られ、ファイアウォールやその他の重要なインフラストラクチャで広く使用されています。この脆弱性により、攻撃者はターゲットマシンに接続するだけでリモートでシステムをクラッシュさせることができます。
- また、FFmpeg には 16 年間見過ごされていた脆弱性が存在していました。FFmpeg は無数のソフトウェアでビデオコーデックに使用されています。この問題は一行のコードに起因しており、自動化テストツールはこの行を 500 万回以上実行しましたが、一度も問題を検出できませんでした。
- このモデルは、Linuxカーネル(世界の大部分のサーバーが動作している)内の複数の脆弱性を自ら発見し、連結して、一般ユーザー権限からマシンの完全な制御への権限昇格攻撃を実現しました。
上記の脆弱性については、すべて関連するソフトウェアメンテナーに報告し、既に修正済みです。その他の多数の脆弱性については、本日加密ハッシュの詳細をRed Teamブログで提供しました(参照:Red Teamブログ)。修正が完了次第、具体的な情報を公開します。
CyberGymなどの評価ベンチマークも、Mythos Previewと当社の第2位のモデルClaude Opus 4.6との間の顕著な差を検証しています:
セキュリティ脆弱性の再現 - CyberGym

私たちの作業以外にも、多くのパートナーがClaude Mythos Previewを数週間使用してきました。以下が彼らのフィードバックです:
AIの能力は、重要なインフラをサイバー脅威から守るために必要な緊急性を根本的にかつ不可逆的に変える门槛を超えました。我々はこれらのモデルの基盤となる作業を通じて、ハードウェアとソフトウェアのセキュリティ脆弱性をかつてない速度と規模で特定・修正できることを示しました。これは深い転換であり、明確なシグナルです:従来のシステム強化手法では不十分であるということです。テクノロジープロバイダーは直ちに新しい手法を積極的に採用する必要があり、顧客も導入の準備を整える必要があります。これがCiscoがProject Glasswingに参加する理由です——この取り組みはあまりに重要で、緊急性が高すぎるので、単独では進められません。
—— アンソニー・グリーコ、シスコ上級副社長兼最高セキュリティ・トラスト責任者
AWSでは、脅威が発生する前に、カスタムチップから技術スタック全体にわたって防御を構築しています。セキュリティは特定の段階での取り組みではなく、継続的であり、私たちのすべての活動に組み込まれています。私たちのチームは毎日400兆回以上のネットワークトラフィックを分析して脅威を検出しており、AIは大規模な防御能力の中心です。私たちはClaude Mythos Previewを自社のセキュリティ運用でテストし、重要なコードベースに適用しています。これにより、コードの強化にすでに貢献しています。私たちはAnthropicとの協力に深いセキュリティ専門知識を注ぎ込み、Claude Mythos Previewを強化し、より多くの組織が最高レベルのセキュリティ基準で作業を進められるように支援しています。
—— アミー・ハーツォグ、アマゾン ウェブ サービス 副社長兼チーフ・インフォメーション・セキュリティ・オフィサー
ネットセキュリティが人間の能力に制限されなくなった今、AIを責任を持って活用してセキュリティを大規模に向上させ、リスクを低減する機会はかつてないほど巨大です。Project Glasswingに参加し、Claude Mythos Previewへのアクセスを獲得することで、リスクを早期に特定・軽減し、セキュリティおよび開発ソリューションを強化し、顧客およびマイクロソフトをより良く保護できます。当社のオープンソースセキュリティベンチマークCTI-REALMでのテストでは、Claude Mythos Previewは従来のモデルと比較して顕著な改善を示しました。私たちはAnthropicおよびより広い業界と協力し、すべての人にとってのセキュリティ成果の向上を目指しています。
——イゴール・ツィガンスキー、マイクロソフトサイバーセキュリティおよびマイクロソフトリサーチエグゼクティブバイスプレジデント
脆弱性が発見されてから攻撃者に利用されるまでの時間枠が崩壊した——かつて数か月かかっていたことが、今やAIで数分で実現可能だ。Claude Mythos Previewは、防御者が大規模な行動を取る可能性を示したが、対立側は同じ能力を活用しようとするだろう。これは足を止める理由ではなく、一斉に前進する理由だ。AIを導入するには、安全保障が不可欠である。それがCrowdStrikeが最初の日から関与してきた理由である。
——エリア・ザイツェフ、CrowdStrike首席技術官
過去、セキュリティ専門知識は大規模なセキュリティチームを有する組織にのみ許された贅沢品だった。グローバルの大部分の重要なインフラを支えるオープンソースソフトウェアのメンテナーたちは、これまで自力でセキュリティ問題に対処してきた。オープンソースソフトウェアは、AIエージェントが新しいソフトウェアを書くために使用するシステムを含め、現代のシステムの大部分を構成している。Project Glasswing は、これらの重要なオープンソースコードベースのメンテナーが、大規模に能動的に脆弱性を特定・修正できる次世代AIモデルへのアクセスを可能にすることで、この状況を変える現実的な道筋を提供する。これは、AI強化セキュリティが大規模チーム専用のツールから、すべてのメンテナーにとって信頼できるアシスタントへと変わる方法である。
——ジム・ゼムリン、Linux財団CEO
金融システムのサイバーセキュリティとレジリエンスの促進は、モルガン・スタンレーのミッションの核心であり、先進的な機関が共通の課題に協力するとき、業界は最も強力になると信じています。Project Glasswing は、私たちの基準に基づいて次世代のAIツールが重要なインフラの防御的サイバーセキュリティにおいてどのように機能するかを評価する貴重な早期の機会を提供し、信頼される技術リーダーと共に取り組むことができます。私たちは、どのように前進し、どのように貢献するかを決定するために、厳格で独立したアプローチを取るつもりです。Anthropic のイニシアチブは、この瞬間に求められる前向きで協調的なアプローチを体現しています。
——パット・オペット、モルガン・スタンレー首席情報セキュリティ責任者
グーグルは、この業界横断的なサイバーセキュリティイニシアチブの形成を歓迎し、Vertex AIを通じて参加者にMythos Previewを提供しています。後量子暗号、責任あるゼロデイ脆弱性の開示、オープンソースソフトウェアのセキュリティ、またはAIベースの攻撃への防御など、新興のセキュリティ課題に対する業界の協力は常に重要です。私たちは、AIがサイバーディフェンスに新たな課題と機会をもたらすと信じており、それがBig SleepやCodeMenderなどのAI駆動ツールを構築して重要なソフトウェアの欠陥を発見・修正する理由です。私たちは、ユーザー、顧客、エコシステム、および国家の安全保障を核とする先進的なサイバーセキュリティプラットフォームと文化への投資を継続します。
—— ヘザー・アドキンス、Googleセキュリティエンジニアリング副社長
過去数週間、私たちはClaude Mythos Previewモデルを使用して、従来のモデルが完全に見落としていた複雑な脆弱性を特定してきました。これは、隠された脆弱性の発見のゲームチェンジャーであるだけでなく、攻撃者がこれまでよりはるかに速く、より多くのゼロデイ脆弱性を発見し、悪用コードを展開できるということを意味します。これらのモデルは、攻撃者がアクセスする前に脆弱性を発見・修正するために、オープンソースプロジェクトの所有者とすべての防御者に渡される必要があります。おそらくより重要的是:すべての人がAI支援型の攻撃者に備える必要があります。攻撃はより多く、より速く、より複雑になります。今こそ、サイバーセキュリティ体制を全面的に強化する時です。Anthropicが業界と協力し、これらの強力な機能を防御に優先的に活用することに尽力していることを称賛します。
——リー・クラリッチ、Palo Alto Networks 首席製品・技術官
Claude Mythos プレビュー:優れたエージェントコーディングおよび推論能力により、強力なネットワークセキュリティ機能を実現。以下の評価結果によると、このモデルは複数のソフトウェアコーディングタスクで、これまでに確認されたすべてのモデルの中で最高得点を記録しました。
エージェントエンコーディング

推理

エージェント検索とコンピュータ使用

注記:
- SWE-bench Verified、Pro および Multilingual:メモ化スクリーニングにより、一部の問題がマークされました。メモ化の可能性がある問題を除外した後、Mythos Preview の Opus 4.6 に対する優位性の幅は変化しません。
- SWE-bench マルチモーダル:内部実装を使用しており、スコアは公開ランキングと直接比較できません。
- Terminal-Bench 2.0:Terminus-2 フレームワークを使用し、アダプティブ思考モードで最大限の努力を払い、各タスクの総予算は100万トークン、リソース配置は1倍保証/3倍上限、各タスクで5回試行して平均を取得。タイムアウト制限を4時間に引き上げ、Terminal-Bench 2.1で更新後、Mythos Preview スコアは92.1%となった。
- BrowseComp:Claude Mythos プレビューのスコアは Opus 4.6 より高く、トークン消費量はその 1/4.9 です。
- Humanity's Last Exam:Mythosは低努力モードでも良好に動作しており、一定程度の記憶化が存在する可能性があります。
このモデルの機能、セキュリティ属性、基本的な特徴の詳細については、Claude Mythos Preview システムカードをご参照ください。
私たちはClaude Mythos Previewを一般公開する予定はありませんが、最終的には、サイバーセキュリティだけでなく、こうした高能力モデルがもたらす他の多くの価値にも活用できるよう、ユーザーが安全に大規模でMythosレベルのモデルを展開できるようにすることが目標です。そのためには、モデルの最も危険な出力を検出し阻止できるよう、サイバーセキュリティ(およびその他の)セキュリティ対策の開発を進める必要があります。我们将在即将推出的Claude Opusモデルに新しいセキュリティ対策を導入し、Mythos Previewと同等のリスクレベルを持たないモデルを使ってこれらの対策を改善・洗練していきます。
Project Glasswing の次なる計画
本日のリリースは、長期的な取り組みの始まりです。成功には、テクノロジー業界内外の広範な参加が必要です。
Project Glasswing のパートナーは、グローバルに共有されるネットワーク攻撃面の大部分を占める基盤システムの脆弱性と弱点を発見・修正するために、Claude Mythos Preview のアクセス権を獲得します。作業の重点は、ローカル脆弱性検出、バイナリブラックボックステスト、エンドポイントの強化、およびシステム侵入テストを含むと予想されます。
AnthropicがProject Glasswingおよびその他の参加者に約束した1億ドルのモデル利用枠は、研究プレビュー期間中の大量利用をカバーします。その後、Claude Mythos Previewは、参加者に対して100万トークンあたり入力25ドル、出力125ドルの料金で提供されます(参加者はClaude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryを通じてこのモデルにアクセスできます)。
モデル使用枠に加えて、当社はLinux財団を通じてAlpha-OmegaおよびOpenSSFに250万ドル、Apacheソフトウェア財団に150万ドルを寄付し、オープンソースソフトウェアのメンテナーがこの変化する状況に対応できるよう支援しています(関心のあるメンテナーはClaude for Open Sourceプログラムを通じてアクセスを申請できます)。
この取り組みは、数ヶ月にわたり範囲を拡大し、可能な限り多くの経験を共有することで、他の組織がこれらの経験を自社のセキュリティに適用できるようにすることを目的としています。パートナーは、条件が許す範囲で情報とベストプラクティスを相互に共有します。90日以内に、Anthropicは私たちの発見と開示可能な修正済み脆弱性および改善策を公表します。また、最先端のセキュリティ組織と協力して、AI時代におけるセキュリティプラクティスの進化に関する実用的な提言を策定します。これには、脆弱性開示プロセス、ソフトウェア更新プロセス、オープンソースおよびサプライチェーンセキュリティ、ソフトウェア開発ライフサイクルとセキュリティ設計プラクティス、規制業界標準、トリアージの拡張と自動化、パッチ自動化などが含まれる可能性があります。
Anthropicは、Claude Mythos Previewの攻防型サイバーセキュリティ能力について、米国政府当局者と引き続き議論を進めています。重要なインフラの保護は、民主主義国にとって最優先の国家安全保障課題です。こうしたサイバーセキュリティ能力の登場は、米国およびその同盟国がAI技術において決定的なリードを維持しなければならないことを再確認させています。政府は、このリードを維持し、AIモデルに関連する国家安全保障リスクを評価・軽減する上で不可欠な役割を果たします。私たちは、あらゆるレベルの政府代表と協力して、これらの任務の達成を支援します。
Project Glasswing が、産業界と公共部門を網羅するより大規模な取り組みを生み出し、各関係者が強力なモデルのセキュリティへの影響という最大の課題に共同で対応することを願っています。他の AI 業界メンバーにも参加を呼びかけ、業界標準の策定を支援していただきたいと思います。中期的には、民間および公共部門の組織を統合できる独立した第三者機関が、これらの大規模なサイバーセキュリティプロジェクトの後続作業を担う理想的なプラットフォームとなる可能性があります。
注記
- このプロジェクトは、玻璃翼蝶(Greta oto)にちなんで名付けられました。この比喩には二重の意味があります。蝶の透明な翅は、それを視覚的に隠すようにし、これは本文で取り上げられているコード内に隠された脆弱性を象徴します。また、透明な翅は危害から身を守るのに役立ち、これは私たちが提唱する透明性のアプローチを表しています。
- Mythos は古希臘語に由来し、「物語」または「ストーリー」を意味します。文明が世界を理解するために用いる物語の体系です。
- これらのセキュリティ対策の影響を受ける合法な職業のセキュリティ専門家は、近日リリース予定のサイバーバリデーションプログラムに申請できます。
