Anthropic 表示 AI 自我改進的路徑正變得清晰，引發 IPO 敘事爭議

文｜字母AI

Anthropic 昨晚發布了一篇長文，標題為《When AI builds itself》（當 AI 自我構建時），聽起來像是阿西莫夫的某本科幻小說，主題也確實是一個很科幻的概念：recursive self-improvement（遞歸自我改進）。

Claude

簡單來說，過去是人類研究員撰寫代碼、進行實驗、訓練模型，從而讓 AI 更強大。但如果 AI 自己開始參與設計、訓練、測試和優化其後續版本，那麼 AI 的進步速度就不再僅由人類推動，而可能開始由 AI「自我進化」。

為此，Anthropic 發出呼籲：

We believe that if the world could choose to slow down or temporarily halt the development of frontier AI, allowing social structures and alignment research to catch up with technological advancements, it would be greatly beneficial to the world.

這句話聽起來像是一則安全警告，但在 Anthropic 準備 IPO 的時點上，也很難不被視為另一種敘事預演：Claude 實在太好用了，甚至開始自行創造下一代 Claude 了。

新的風暴已經出現

為了說明 AI 正在越來越多地參與 AI 研發本身，Anthropic 提供了大量內部數據。

例如，截至2026年5月，Anthropic合併到程式碼庫的程式碼中，超過80%由Claude編寫。而在Claude Code發布之前，這個數字僅為個位數。

到2026年第二季度，根據Anthropic的統計，工程師每天合併的代碼量已比2024年高出約8倍。

Claude

更值得注意的是，Claude 正在處理更開放的工程問題。

Anthropic 在文中表示，過去一年中，員工糾正 Claude、將 Claude 拉回正軌或中途接手任務的頻率持續下降。這種變化不僅發生在簡單任務上，也發生在最複雜的開放式任務上。

所謂開放式任務，就是沒有明確說明書的問題。例如系統崩潰、訓練任務中斷，工程師一開始也不知道答案長什麼樣，只能一邊排查一邊判斷。

這類任務過去最依賴人的經驗，而在那些最開放的任務裡，Claude 的成功率在 2026 年 5 月已達到 76%，六個月內提高了 50 個百分點。

Claude

不僅僅是寫代碼，Anthropic 還使用 Claude 進行代碼審查，檢查 bug、安全漏洞和其他缺陷。他們進行回溯分析後發現，如果過去每次代碼變更都經過 Claude 自動審查，大約三分之一導致 claude.ai 線上事故的 bug，本可於上線前被攔下。

更進一步，Claude 已經開始參與研究流程。

Anthropic 有一個固定測試：給 Claude 一段訓練小型模型的代碼，讓它在不改變結果的前提下，想辦法讓代碼運行得更快。2025 年 5 月，Claude Opus 4 大約能實現 3 倍加速；到了 2026 年 4 月，Claude Mythos Preview 已將這一數字推高至約 52 倍。

Anthropic 還提到一個開放式 AI 安全研究案例。他們將一個問題交給由 Claude 驅動的智能體：一個較弱的模型能否可靠地監督一個更強的模型？

這個過程需要提出假設、測試假設，並與並行智能體共享發現，反覆迭代。

兩位人類研究員花了一週時間，縮小了約 23% 的差距；而 Claude 在累計約 800 小時、約 1.8 萬美元算力消耗下，縮小了 97%。

這項結果當然有局限，問題是人類選的，評分標準也是人類定的，結果也沒有完全遷移到生產規模模型上。但它仍然說明，Claude 已經可以在一個人類設定好方向的研究框架裡，自己設計實驗、自己執行、自己迭代。

此外，當人類研究員「走錯路」時，Claude 還能提供更佳的下一步判斷。

Anthropic 從 129 個內部 Claude Code 研究會話中挑選出一些節點，這些會話中人類研究員與 Claude 一起解決開放式研究問題。Anthropic 選出其中一些「人類後來證明走了彎路」的節點，然後將這些節點之前的上下文提供給不同版本的 Claude，觀察它會建議下一步如何進行。再由另一個知道完整會話結局的 Claude judge 判斷：模型的建議與人類當時的選擇，哪一個更好。

結果表明，在那些人類研究員事後被證明有改進空間的節點上，Claude 越來越能提出更好的下一步。

Claude

過去，AI 模型的進步主要由人類研究員和工程師推動。人類決定進行哪些實驗、編寫代碼、訓練模型，並推動 AI 的功能迭代。

現在，這條鏈條中越來越多的環節，開始被 Claude 接走。

Anthropic 提供了一個非常直觀的階段表：

Claude

2021 年到 2023 年，Anthropic 與普通科技公司沒有什麼區別，都是人類在筆記型電腦上寫代碼、寫文件。

2023 到 2025 年，聊天機器人開始進入工作流程。工程師讓模型生成程式碼片段，再複製到編輯器中。

2025 到 2026 年，編程智能體出現，Claude 開始能自主編寫和修改代碼，有時甚至能獨立完成整個文件。

到今天，智能體已經可以自行運行代碼，還能將耗時數小時的工作委派給其他智能體。

再往後，就是 Anthropic 真正擔心的那個階段：閉合迴路。

如果這一天到來，Claude 的後續版本就可能由 Claude 自身持續改進——這就是 recursive self-improvement，遞歸自我改進。

Anthropic 在文中謹慎表示：我們尚未走到那一步，遞歸自我改進也非必然發生。但它仍強調，通往那一步的路徑，已開始變得清晰可見。

因此，Anthropic 才會在文章結尾談到減速，甚至暫停。它的意思並非現在所有 AI 公司立即停工，而是說，如果未來 AI 自我改進的風險持續上升，前沿實驗室需要一套協調、可驗證的減速機制。

In other words, the singularity is coming, and humanity must take control.

勢不可擋的 Claude

如果只看表面，這是一篇非常具有前瞻意識的安全文件。Anthropic 在談論遞歸自我改進，談論 AI 可能越來越快地改進自己，談論人類社會需要提前準備減速和暫停機制。

但放在 Anthropic 準備 IPO 的時間點上，這篇文章就有了另一層意思。

在某種意義上，A 廠最近的動態很像班上那種欠兒欠兒的優等生——它確實有能耐，但也確實很裝。

它想說的不只是「我們有一個很強的 Claude」，更進一步，它想說「Claude 正在幫助我們製造更強的 Claude」。

如果 Anthropic 只是賣一個模型或一個工具，它就很難徹底擺脫橫向比較：Anthropic 有 Claude，OpenAI 有 GPT；Anthropic 有 Claude Code，OpenAI 有 Codex；Anthropic 抢企業客戶，OpenAI 也搶企業客戶。兩家公司的競爭非常膠著，就看誰能向市場講出更大的故事。

需要注意的是，就在 3 天前，OpenAI 前腳在一份關於前沿 AI 治理的文件裡寫道：

我們也在今天的系統中看到了遞歸自我改進的早期跡象：AI 的發展本身正被 AI 加速。

這將加劇開發者與國家之間的競爭壓力，並帶來現有機構無法應對的治理挑戰。

3 天後，Anthropic 隨即表示：Claude 通往遞歸自我改進的路徑，已開始變得可見。

Claude

如果 Claude 真如其所期望的那樣發展，就不再是普通的產品敘事，而會變成一個研發飛輪。

Claude 寫代碼、運行實驗、優化訓練流程，再反過來減少 Anthropic 自身產品中的事故……一旦這套系統運行起來，Claude 就不再只是 Anthropic 的一個產品，也是 Anthropic 的重要生產工具。

用戶看到的是 Claude 這個產品，企業客戶購買的是 Claude 的能力，但 Anthropic 真正希望資本市場關注的是：Claude 已經嵌入到前沿模型研發的底層流程中，它已被放入 Anthropic 的發動機艙裡。

資本市場最愛聽飛輪的故事，像聚寶盆一樣財源滾滾：更強的 Claude 讓 Anthropic 的工程師能合併更多代碼，更多代碼讓產品和基礎設施迭代更快，更快的迭代讓研究員能跑更多實驗，更多實驗又反過來幫助下一代 Claude 變強。下一代 Claude 變強後，再繼續加速 Anthropic 的研發。

Claude 的迭代速度也在推動這個飛輪。從公開發布時間來看，2023 年至 2025 年初，Claude 的主要模型更新大多為每三四個月一次，但在進入 Claude 4 後，Anthropic 的模型更新明顯變得更頻密。

Claude 4 於 2025 年 5 月發布，Opus 4.1 於 8 月發布，Sonnet 4.5 於 9 月發布，Haiku 4.5 於 10 月發布，Opus 4.5 於 11 月發布。

到2026年，Opus 4.6 於 2 月 5 日發布，Sonnet 4.6 於 2 月 17 日發布，Opus 4.7 於 4 月 15 日發布，Opus 4.8 於 5 月 28 日發布。Opus 4.7 到 Opus 4.8 僅相隔 42 天。

Anthropic 表面上是在說「這件事可能很危險，我們要提前準備剎車」，但它同時也在暗示：「我們已經看見油門踩下去之後會發生什麼。」

IPO 叙事的精妙之處就在於此。它一方面將風險講得非常嚴重，另一方面也將自己的技術地位抬得很高。

並非所有 AI 公司都有資格討論遞歸自我改進，你得先讓外界相信，你的 AI 已經進入了 AI 研發流程，才有資格說這件事可能需要全球協調。

OpenAI：怎麼可以這樣？

前面提到，就在 Anthropic 發這篇長文之前，OpenAI 剛剛把遞歸自我改進擺上了桌。

但兩家公司的說法很不一樣。

OpenAI 的《Democratic Governance of Frontier AI》是一份寫給華盛頓的政策藍圖，它關心的不是「模型怎麼變強」，而是當前沿 AI 繼續向前衝時，該如何加以約束。

該報告中提到的大多內容不太適合加以贅述，唯獨一句話至關重要：OpenAI 表示，今天的系統中，已經可以看到遞歸自我改進的早期跡象。

這句話和 Anthropic 的這篇長文，其實指向同一個方向。

但 OpenAI 在談制度，Anthropic 在談自己。

OpenAI 的意思是：AI 發展太快，現有的治理結構可能跟不上，因此需要一套新的規則。

而 Anthropic 直接將該系統展示出來，告訴市場：Claude 已經進入我們的研發流程，因此我們看到了 AI 自我加速的路徑。

這一手玩得很高明，感覺 OpenAI 內部指不定已經開始蛐蛐了——這簡直是剽竊創意！明明是我們先來的！

開個玩笑，不過 OpenAI 確實需要加把勁了，快點把 GPT 5.6 推上來吧。