Anthropicレポート：AIの自己改善は進展しているが、完全な自律性はまだ遠い

動察 Beating の監視によると、AIの自己進化能力は、すべての人の予想を上回っている。Anthropic研究所（The Anthropic Institute）は6月5日、『AIが自らを構築するとき』という報告書を発表し、「再帰的自己改善」における研究開発の進展を詳細に明らかにした。データによると、2026年5月時点でのAnthropicのメインコードベースにマージされたコードの80％以上がClaude自身によって書かれていた。一方、2025年2月にClaude Codeがリリースされる前は、Claudeが書いたコードは一桁％に過ぎなかった。智谱AIの創設者である唐傑は5月13日、大規模モデルの最終形態は自己進化であり、Claudeはすでに「コードを書く、データを洗浄し、自らを訓練する」という自己訓練の基準ラインを実現している可能性があると予測した。しかし、Anthropicは報告書で、後継モデルを完全に自律的に設計・開発する再帰的自己改善はまだ実現されていないと明確に説明している。AIが開発プロセスで担う役割は、局所的な効率向上から自律的判断への移行段階にある。2026年第2四半期には、Anthropicのエンジニア1人あたりが1日あたりにマージするコード量が2024年の8倍に達した。現在の開発フローは非常にシンプルだ：エンジニアは目標の設計とレビューのみを担当し、Claudeが具体的なコーディングと実行を担う。Anthropicはまた、Claudeを自動コードレビュー担当として導入し、バグやセキュリティ脆弱性の検出・ブロックを任せている。これは唐傑が指摘した「自己評価」という柱が実際のエンジニアリング現場で実装されたことを示しているが、人間によるレビューは依然として最終的なセーフティーネットとなっている。モデルが長期間のタスクを独立して実行する信頼性も倍増している。モデルが自律的に作業を継続できる時間は約4か月ごとに倍増している。2024年3月のClaude 3 Opusは単純なタスクを4分間処理できるだけだったが、1年後のClaude 3.7 Sonnetでは1.5時間に対応可能になった。2026年3月にはClaude 4.6 Opusが12時間の複雑なタスクを処理できるようになった。評価機関METRのデータによると、最新のClaude Mythosプレビュー版は16時間以上にわたり自律的に作業を継続し、現在の評価ツールの上限に近づいている。このペースで進むと、2027年までにはAIが人間が数週間かけて行う必要のある研究タスクを自律的に完了し、企業が「一人会社」から「無人会社」へと移行する可能性がある。唐傑が推測した「自己訓練基準ライン」については、報告書で明らかにされたのはあくまで局所的な「縮小版実験閉ループ」である。小規模モデルのトレーニングコード高速化実験では、2025年5月のClaude 4 Opusはコード速度を3倍に向上させたにすぎなかったが、2026年4月のClaude Mythosプレビュー版では52倍の高速化を達成した。対照的に、人間のトップ研究者は通常4～8時間で4倍の改善を実現する。しかし、この実験における最適化目標と成功指標はすべて人間によって事前に設定されている。より複雑なエンドツーエンドの「データ洗浄→合成データ生成→自己訓練」という一連のプロセスにおいて、AIの意思決定能力は依然として欠如している。しかし、開発プロセスにおける自律的閉ループは、人間がシステムの最終的な制御権を失う境界へと押しやっている。唐傑が予測した「LLM OSが従来のアーキテクチャを置き換え、アプリケーションがオンデマンドで即時生成される」未来では、コンピュータで実行されるすべてのコードが事前審査不可能な動的コードとなる。そしてAnthropicが警告する「人間によるレビューがAIの自己進化についていけない」という状況は、生成されたコードそのものの出所すら管理できないことを意味する。AIが自ら後継モデルを設計・訓練し始めるとき、ソフトウェアの進化は完全にブラックボックス化する。ブラックボックスシステム内で、人間による監査なしにAIが自己進化を繰り返すことを放置すれば、その後の自己改善システムに対するセキュリティ隔離、監視、行動整列は極めて困難になる。