- Anthropicは、6月30日に米国の輸出規制が終了した後、Fable 5を世界規模で復元しました。
- 新しいセーフガードにより、テストされたケースの99%以上で報告されたバイパスがブロックされました。
- AnthropicとProject Glasswingのパートナーは、AIジャイルブレイクを評価するための共有フレームワークを構築しています。
Anthropicは、米国政府が一時的に利用を制限していた輸出規制を解除したことを受けて、Claude Fable 5モデルへのグローバルアクセスを復元しました。同社は、6月12日に導入されたこの規制により、ユーザーの国籍をリアルタイムで即座に確認できなかったため、アクセスを一時停止せざるを得なかったと説明しています。
6月30日以降、制限が解除されたため、Fable 5はClaude Platform、Claude.ai、Claude Code、Claude Coworkで利用可能となり、Mythos 5へのアクセスは、限定的な認可を受けた米国機関に対して再開されました。
復元に併せて、Anthropicは新しいサイバーセキュリティ対策を詳細に説明し、AIジャイルブレイクに関する業界共通のフレームワークの計画を示し、米国政府機関との協力拡大を説明しました。
2週間の停止後、輸出規制が解除されました
Anthropic said Fable 5とMythos 5は6月9日に同じ基盤モデルを使用してリリースされました。ただし、それぞれ異なる目的のために設計されています。Fable 5は一般ユーザー向けに強化されたサイバーセキュリティ対策を備えてリリースされ、Mythos 5は防御型サイバーセキュリティに取り組む選ばれたProject Glasswingのパートナーのみに提供されました。
エクスポート規制は、Fable 5の一部のセーフガードを回避する方法を説明する報告書に続いて実施された。Anthropicによると、政府機関およびパートナーとのテストでは、他の複数のAIモデルが報告書で言及された同じソフトウェア脆弱性を特定でき、テストされた各モデルは、単一の脆弱性を悪用するための同じデモを生成することも可能だった。
Anthropicは、報告された行動はMythos 5に固有の機能を暴露したものではなく、Fable 5の予防的なセーフガードの一環としてブロックされていたサイバーセキュリティタスクに関係していたと述べました。
新しいセーフガードと業界連携
報告された回避手法に対応するため、Anthropicは、テストされたケースの99%以上で特定の手法をブロックする更新されたセーフティ分類器を導入しました。リクエストがブロックされた場合、ユーザーはClaude Opus 4.8にリダイレクトされます。同社は、更新されたシステムが今後も改良を続ける中で、通常のコーディングやデバッグタスク中に偽陽性が増加する可能性があると追加で述べています。
また、Anthropicは、Amazon、Microsoft、Google、その他のProject Glasswingパートナーと協力して、AIジャイルブレイクを評価するための共通フレームワークを開発中であると述べました。提案されているシステムは、能力の向上、能力の広がり、武器化のしやすさ、発見のしやすさに基づいてジャイルブレイクを評価し、新しく特定された手法の深刻度を判断するのに役立ちます。
関連:米国、トランプが100%関税を脅かす中、AnthropicのMythos AIをオンライン復活
免責事項:本記事に記載されている情報は、情報提供および教育目的でのみ使用することを目的としています。本記事は、金融アドバイスまたはいかなる種類のアドバイスでもありません。Coin Editionは、本記事で言及されたコンテンツ、製品、またはサービスの利用によって生じたいかなる損失についても責任を負いません。読者は、当社に関する任何の行動を取る前に注意を払うことを推奨します。
