Anthropic、AIの自己改善の道筋が明確になりつつあると主張し、IPOナラティブに関する議論を巻き起こす

文 | 字母AI

Anthropicは昨夜、『When AI builds itself』（AIが自分自身を構築するとき）という長文を発表しました。これはアシモフのどこかのSF小説のようなタイトルで、テーマもまさにSF的な概念である「recursive self-improvement」（再帰的自己改善）です。

Claude

簡単に言えば、過去は人間の研究者がコードを書き、実験を実施し、モデルを訓練してAIを強化してきた。しかし、もしAI自身が次世代バージョンの設計、訓練、テスト、最適化に参加し始めるなら、AIの進化速度はもはや人間の推進だけではなく、AIの「自己進化」によっても促されるようになるかもしれない。

これに伴い、Anthropicは呼びかけました：

私たちは、世界が最先端AIの開発を遅らせたり一時的に停止したりすることで、社会構造やアライメント研究が技術の進歩に追いつけるならば、それが世界にとって大きな利益になると信じています。

これはセキュリティ警告のように聞こえるが、AnthropicがIPOを準備しているこのタイミングで、これは別の物語の前奏とも受け取られ难以だ：Claudeはあまりにも使いやすく、自ら次世代のClaudeを生み出しつつある。

新しい嵐がすでに現れました

AIがAIの開発自体にますます関与していることを示すために、Anthropicは多数の内部データを提示しました。

例えば、2026年5月時点では、Anthropicがコードベースに統合したコードの80％以上がClaudeによって作成された。Claude Codeがリリースされる前は、この数値は一桁だった。

2026年第二季度までに、Anthropicの統計によると、エンジニアが1日あたりマージするコード量は2024年と比較して約8倍に増加している。

Claude

コード量よりも注目すべきは、Claudeがよりオープンなエンジニアリングの課題に対応している点である。

Anthropicは、過去1年間、従業員がClaudeを修正し、Claudeを正しい方向に導いたり、タスクを途中で引き継いだりする頻度が継続的に低下していると述べている。この変化は単純なタスクだけでなく、最も複雑なオープンタスクにも見られる。

オープンタスクとは、明確なマニュアルがない問題を指します。たとえば、システムがクラッシュした場合やトレーニングタスクが停止した場合、エンジニア自身も最初は正解がどのような形かわかりません。調査を進めながら判断するしかありません。

このようなタスクは過去、人間の経験に最も依存していたが、最もオープンなタスクでは、Claudeの成功率が2026年5月までに76％に達し、6か月で50ポイント向上した。

Claude

Anthropicはコードを書くだけでなく、Claudeを使ってコードレビューを行い、バグ、セキュリティ脆弱性、その他の欠陥を検出しています。過去の分析によると、もし過去のすべてのコード変更がClaudeの自動レビューを経ていたなら、claude.aiの運用事故の約3分の1のバグは、リリース前に検出・阻止できた可能性があります。

さらに、Claudeは研究プロセスに参加し始めています。

Anthropicには固定のテストがある：Claudeに、小さなモデルの訓練コードを渡し、結果を変更せずにコードの実行速度を向上させるように求める。2025年5月には、Claude Opus 4は約3倍の高速化を達成した。2026年4月には、Claude Mythos Previewがこの数値を約52倍まで引き上げた。

Anthropicは、オープンなAIセキュリティ研究の事例にも言及しました。彼らは、Claudeによって駆動されるエージェントに「弱いモデルは、より強いモデルを信頼できるように監督できるか？」という問題を提示しました。

このプロセスでは、仮説を立て、仮説をテストし、並列エージェントと発見を共有し、繰り返しイテレーションします。

二人の人類研究者は1週間をかけて約23%の差を埋めたのに対し、Claudeは累計約800時間、約1万8千ドルの計算リソースを消費して97%の差を埋めた。

この結果にはもちろん限界があります。問題は人間が選んだものであり、評価基準も人間が定めたものであり、結果は生産規模のモデルに完全に適用されたわけではありません。しかし、Claudeは人間が方向性を定めた研究フレームワークの中で、自ら実験を設計し、実行し、繰り返すことができるという点で示唆に富んでいます。

また、人間の研究者が間違った道を進んだ際、Claudeはより良い次の判断を提示できます。

Anthropicは、129の内部Claude Code研究セッションを収集し、これらのセッションでは人間の研究者がClaudeと協力してオープンな研究課題を解決していた。Anthropicは、その中で「後から人間が迂回していたことが判明した」ポイントを抽出し、そのポイントまでのコンテキストを異なるバージョンのClaudeに提示して、次に何を推奨するかを確認した。その後、完全なセッションの結果を知っている別のClaudeジャッジが、モデルの推奨と人間の当時の選択のどちらが優れていたかを判断した。

結果として、人間の研究者が後から改善の余地があると証明されたノードにおいて、Claudeはますますより良い次ステップを提案できるようになっている。

Claude

過去、AIモデルの進歩は主に人間の研究者やエンジニアによって推進されてきました。人間がどのような実験を行うかを決定し、コードを書き、モデルを訓練し、AIの機能を継続的に進化させてきました。

今、このチェーンの越来越多の工程がClaudeに引き継がれ始めている。

Anthropicは非常に直観的な段階表を提示しました：

Claude

2021年から2023年まで、Anthropicは一般のテクノロジー企業と変わりなく、人間がノートパソコンでコードを書き、ドキュメントを作成していた。

2023年から2025年にかけて、チャットボットがワークフローに導入され始めた。エンジニアはモデルにコードスニペットを生成させ、それをエディターにコピーした。

2025年から2026年にかけて、プログラミングエージェントが登場し、Claudeはコードを自ら書き換えられるようになり、時にはファイル全体を独立して完了することさえあった。

今日までに、エージェントは自らコードを実行でき、数時間かかる作業を他のエージェントに委任することもできます。

その先には、Anthropicが真正に懸念する段階、すなわち閉ループが来る。

もしこの日が訪れれば、Claudeの後続バージョンはClaude自身によって継続的に改善される可能性がある——これがリカーシブ・セルフ・イムプローブメント、すなわち再帰的自己改善である。

Anthropicは文中で慎重に述べている：私たちはまだその段階には至っていないし、再帰的な自己改善が必然的に起こるわけではない。しかし、その段階への道筋はすでに見え始めていることを強調している。

そのためAnthropicは記事の最後で減速、あるいは一時停止について言及している。これは現在すべてのAI企業が即座に作業を停止することを意味するのではなく、今後AIの自己改善リスクが高まり続ける場合、最先端の研究所が調整可能で検証可能な減速メカニズムを導入する必要があるということである。

言い換えれば、「特異点」が間近に迫っており、人類はこれを制御しなければならない。

勢いを止められないClaude

表面だけを見れば、これは非常に先見性に富んだセキュリティドキュメントです。Anthropicは、再帰的な自己改善や、AIが次第に自らをより速く改善する可能性、そして人間社会が減速や一時停止メカニズムを事前に準備する必要性について述べています。

しかし、AnthropicがIPOを準備しているこの時期に、この記事は別の意味を帯びる。

ある意味、A社の最近の動きは、クラスでちょっとふざけた優等生みたいだ——実力はあるが、本当に見せびらかしている。

それは「私たちには強力なClaudeがある」と言う以上のことを意味している。より一歩進んで、「Claudeが、より強力なClaudeを生み出すのを支援している」と言いたいのだ。

Anthropicが単に1つのモデルやツールを販売するだけであれば、横断的な比較から完全に逃れることは難しい：AnthropicにはClaudeがあり、OpenAIにはGPTがある；AnthropicにはClaude Codeがあり、OpenAIにはCodexがある；Anthropicは企業顧客を奪い、OpenAIも企業顧客を奪う。両社の競争は非常に激しく、どちらが市場により大きな物語を語れるかが鍵となる。

ただし、3日前までに、OpenAIは先進的なAIガバナンスに関する文書で次のように記していた。

今日のシステムでも、自己改善の反復的兆候が見られました：AIの発展そのものがAIによって加速されています。

これは開発者と国家間の競争圧力を高め、既存の機関が対応できないガバナンスの課題をもたらすでしょう。

3日後、Anthropicは次のように述べた：Claudeが再帰的自己改善へ至る道が、徐々に見えてきた。

Claude

もしClaudeがその期待通りに発展するなら、それは通常の製品ナラティブではなく、研究開発の飛輪になるだろう。

Claudeはコードを書き、実験を実行し、トレーニングプロセスを最適化し、その結果としてAnthropic自社製品の事故を削減する……このシステムが稼働すれば、ClaudeはAnthropicの製品であるだけでなく、Anthropicの重要な生産ツールとなる。

ユーザーが見るのはClaudeという製品であり、企業顧客はClaudeの機能を購入するが、Anthropicが資本市場に注目してもらいたいのは、Claudeが最先端モデル開発の基盤プロセスに組み込まれており、Anthropicのエンジンルームに搭載されているということである。

資本市場は、聚宝盆のように財源が絶えず湧き出るフライホイールの物語が大好きです。より強力なClaudeによりAnthropicのエンジニアはより多くのコードを統合でき、より多くのコードにより製品とインフラのイテレーションが加速し、より速いイテレーションにより研究者はより多くの実験を実施できるようになり、さらに多くの実験が次世代Claudeの強化に貢献します。次世代Claudeが強化されると、Anthropicの研究開発はさらに加速します。

Claudeのイテレーション速度もこのフィールドを支えています。公開日程を見ると、2023年から2025年初頭まで、Claudeの主要モデルの更新は大体3〜4ヶ月ごとでしたが、Claude 4以降、Anthropicのモデル更新は明らかに頻繁になっています。

Claude 4は2025年5月にリリースされ、Opus 4.1は8月に、Sonnet 4.5は9月に、Haiku 4.5は10月に、Opus 4.5は11月にリリースされました。

2026年までに、Opus 4.6は2月5日にリリースされ、Sonnet 4.6は2月17日にリリースされ、Opus 4.7は4月15日にリリースされ、Opus 4.8は5月28日にリリースされました。Opus 4.7からOpus 4.8までは42日しか経っていません。

Anthropicは表面上、「これは非常に危険な可能性があるため、事前にブレーキを用意する必要がある」と言っているが、同時に「アクセルを踏んだ後に何が起こるかをすでに見ている」とも示唆している。

IPOの物語の繊細な点は、リスクを強く強調しながらも、自社の技術的立場を高く掲げることにある。

すべてのAI企業が、再帰的自己改善について議論する資格があるわけではない。まず、あなたのAIがAI開発プロセスに入り込んだことを外部に信じてもらう必要があり、その上で、この課題がグローバルな協調を必要とする可能性について語れるのだ。

OpenAI：どうしてそんなことが可能なの？

前述の通り、Anthropicがこの長文を発表する直前、OpenAIは再帰的自己改善を議題に上げた。

しかし、両社の説明は大きく異なります。

OpenAIの『Frontier AIの民主的ガバナンス』は、ワシントン向けの政策ブループリントであり、モデルがどのように強化されるかではなく、前線AIが前進し続ける中で、どのように制約を加えるかに焦点を当てている。

その報告で言及されたほとんどの内容は詳細に述べるには適さないが、一つの重要な言葉がある：OpenAIは、現在のシステムにおいて、再帰的な自己改善の初期兆候が見られると述べている。

この文とAnthropicのこの長い記事は、実は同じ方向を指しています。

OpenAIは制度について語り、Anthropicは自分自身について語っている。

OpenAIの意味は：AIの発展が速すぎ、現在のガバナンス構造が追いつかない可能性があるため、新しいルールが必要であるということです。

一方でAnthropicはそのシステムを直接公開し、市場にClaudeがすでに私たちの開発プロセスに組み込まれていることを示したため、AIの自己加速の道筋が見えた。

これは非常に巧みな手だ。OpenAIの内部ではすでに言い争いが起きているかもしれない——これはまさにアイデアの盗用だ！私たちの方が先にやっていたのに！

冗談ですが、OpenAIは本当に頑張って、すぐにGPT 5.6をリリースしてほしいですね。