Anthropic、リスクを評価するために業界全体のAI開発を一時停止すると提案

Claude AIモデルを開発するAnthropicは、6月4日にブログ投稿を公開し、業界全体における最前線のAI開発について、構造的で一時的な停止を提案した。これは、1年前までには主要なAI研究所から考えられることもなかったことだ。

マリナ・ファバロとジャック・クラークが作成したこの提案は、特定かつ実際の不安を引き起こす問題に焦点を当てています。AIモデルは、人間の介入なしに自らの能力を変更・向上させる、再帰的な自己改善の能力に近づいています。

Anthropicが実際に提案していること

これは、すべてのGPUを電源オフにして帰宅するよう呼びかけるものではありません。Anthropicは、主要なAI研究所が安全性の研究と検証システムが追いつくまで、最も先進的な開発作業を一時的に停止することに合意する、協調的で多国間の枠組みを提唱しています。

Anthropicは、一つの企業または一つの国が単独でブレーキをかけるという単側的行動は不十分であり、逆効果である可能性があると明確に主張している。この提案は、米国、中国、その他の本格的なAIプログラムを有する国々の資源に恵まれた研究施設間の協力を想定している。Anthropicは、検証の課題を、信頼に頼るのではなく、合意された検出メカニズムを通じて監視官が遵守を確認する核軍縮から借用した用語で捉えている。

Anthropicは、これらの検出および検証ツールの構築に関する独自の研究を実施し、公開的には一時停止に従っていると主張しながらも、秘密裏に最前線の開発を継続しているかどうかを確認できる、AIの武器査察官に相当するシステムを構築すると述べている。

なぜ今回は2023年と異なる可能性があるのか

2023年、GPT-4を超えるAIのトレーニングに対して6か月の停止を求める公開書簡が、研究者やテクノロジー界の重鎮たちから数千の署名を集めた。しかし、その効果はほぼなかった。競争圧力は集団的な不安よりもはるかに強力であり、主要なすべての研究所が開発を継続した。

Anthropicの提案は構造が異なる。署名によって曖昧なモラトリアムを求めるのではなく、同社は検証可能なコンプライアンス体制を提案している。核兵器管理のアナロジーは完全に不当ではない。国際的な軍縮条約が機能するとき、署名国が小指をかけて約束するからではなく、検査体制と不正に対する制裁があるからである。

2023年まで、再帰的な自己改善は理論的な懸念であった。しかし現在、Anthropicの内部観察によると、現在のモデルはますます自律的にコーディングする能力を高めており、AIシステムが自らの次世代バージョンに意味のある貢献をできるようになる境界に近づいている。

これは投資家にとって何を意味するのか

AI関連資産、特にAIに焦点を当てた暗号通貨トークンや機械学習を活用するブロックチェーンプロジェクトに資金を投資しているすべての人に向け、Anthropicの提案はリスク計算に新たな変数をもたらす。完全に実現しなくても、協調的な一時停止枠組みは、「AIを規制すべきか」という議論から、「国境を越えてコンプライアンスをどう実行するか」という議論へと変える。

AI駆動の暗号資産プロジェクトは、分散型コンピューティングネットワークからAIエージェントトークンまで、AI開発が中断なく継続して加速すると仮定することでその価値の一部を生み出している。信頼できる一時停止枠、あるいはその方向への本格的な規制動向は、そうした評価に不確実性をもたらす可能性がある。

分散型検証システムは、Anthropicが探している解決策の一部となる可能性がある。世界中の研究所が開発制限を遵守していることを確認する必要がある場合、透明で改ざん耐性のある台帳は、その目的に最悪のツールではない。