Anthropic 與 DeepMind 表示 AI 自我改進加速

2026 年 5 月 4 日，Anthropic 聯合創始人 Jack Clark 在社交平台 X 上發佈了一則貼文。原文為：“I now believe there is a 60% chance that recursive self-improvement occurs before the end of 2028.”

貼文發出不到幾分鐘，AI 安全領域長期活躍的研究者 Eliezer Yudkowsky 在下方回覆了一句：「那我們將一起滅亡。」他隨即引用了一個類比，指向切爾諾貝利核反應堆 RBMK 的設計缺陷，暗示這個正在啟動的系統沒有人真正知道如何停止。

這段在幾十秒內完成的對話，就像一根火柴點亮了以往一直藏在技術論文和內部評估中的討論。遞歸自我改進（Recursive Self-Improvement，RSI），即 AI 系統不僅優化輸出，還能自主優化改進過程本身，最終建構出比自身更強的後繼系統，這個長期被擱置在理論邊緣的概念，已被 Anthropic 的聯合創始人納入 2028 年底前 60% 概率的倒數計時中。

一個月後，Anthropic 官方發布了一篇長文，標題為《When AI builds itself》。文章由 Marina Favaro 和 Jack Clark 聯合撰寫，並由 3 月剛成立的 Anthropic Institute 發布。透過一串此前未公開的內部數據與一個精心校準的敘事結構，Anthropic 向外界遞出了一張刻度精準的加速信號卡。這張卡上既寫著「我們還沒有到達那裡」，又寫著「但它可能比大多數機構準備得更快到來」。

在同一個月，DeepMind 執行長 Demis Hassabis 在 Google I/O 舞台上使用了一個從未在公開場合出現過的說法：人類正站在「奇點的山麓」。他在隨後的採訪中，將通用人工智慧（AGI）的時間表從「2030 年之後不久」調整為「2029 年是一個真實可能性」，並承認自己使用戲劇性語言是「有意挑釁」，目的是對政府、經濟學家和公眾製造緊迫感。

兩家以安全為本、長期擔任 AI 行業克制力量的頂級機構，幾乎在同一時間調整了對外發聲的音量與尺度。這個時間點本身，就應被視為一個獨立事件來審視。

一篇被精密校準過的長文

Anthropic 於 6 月 4 日發布的長文開篇便明確了其敘事目標。它所要論證的不僅是一個技術趨勢，更是一個有方向、有加速度的進程。為此，它披露了一組此前從未公開的內部數據。

第一組數字指向一個結構性變化：截至 2026 年 5 月，Anthropic 代碼庫中超過 80% 的合併代碼由 Claude 撰寫。兩年前，這個數字僅為個位數。同一份數據還顯示，2026 年第二季度，Anthropic 的典型工程師每天合併的代碼量是 2024 年的 8 倍。

可以想像任何一個沒有追蹤 AI 行業深度的人第一次看到這兩個數字時的反應。但 Anthropic 自己在腳註中承認了幾個重要的限制條件：領導層曾公開估計，若包括腳本和實驗代碼，Claude 撰寫的代碼占比超過 90%，80% 是一個更保守的合併代碼統計方式；代碼行數「是不完美的度量」，可能高估了真實的生產力提升；代碼歸因管道本身「有缺口」。

這些腳註的寫法本身值得分析。它們的存在表面上是誠實地讓步，但實際上卻讓正文中數字顯得經過審慎的自我篩選，從而獲得更強的可信度。這是一種敘事工程上的雙層結構：正文傳遞訊號，腳註提供免責聲明。

第二組數字涉及速度。在代碼優化任務上，Claude Opus 4 於 2025 年 5 月實現了約 3 倍的加速效果，而人類熟練研究員需耗時 4 至 8 小時才能達到類似水平。到了 2026 年 4 月，Claude Mythos Preview 將這一數字推至約 52 倍。AI 可獨立完成任務的最長時長，也從 2024 年 3 月的 4 分鐘，每 4 個月翻一番，至 2026 年 3 月達到 12 小時。僅憑每 4 個月翻一番的增速本身，就構成了一個極易傳播、帶有幾何級數想像力的記憶點。

另一組數據來自 2026 年 3 月對 130 名 Anthropic 研究團隊員工的內部調查。中位數受訪者估計，使用 Mythos Preview 的產出約為不使用 AI 時的 4 倍。腳註再次指出，METR 此前的獨立研究顯示，開發者對 AI 生產力提升的估計可能總體偏高。同樣的雙層結構再次出現。

第三組數字指向 AI 正在逼近人類研究員的判斷力邊界。2025 年 11 月，Claude Opus 4.5 在研究方向選擇上，有 51% 的情況下優於人類研究員的選擇。到了 2026 年 4 月，這個數字上升到 64%。樣本量 129 個案例，Anthropic 在腳註中說明這些案例是人刻意挑選的、人類選擇有改進空間的時刻。

單獨挑出任何一個數字，都可以放入不同的解釋框架中。但當它們放在一起時，方向是一致的：速度正在加快，差距正在縮小，而這一切發生在 Anthropic 自己的代碼庫和實驗室內部，而非某個外部基準上的理論推演。

長文在列出這些數據之後，擺出了三種未來場景。

第一種是趨勢停滯，進入 S 曲線平台期。Anthropic 的表述是“我們不相信這很可能”。

第二種是複合效率提升，AI 在更廣泛的研發環節持續替代人類，但人類仍設定方向、定義成功標準。Anthropic 評價為「證據表明我們很可能正走向這種場景」。

第三種是完全遞歸自我改進，AI 自主設計、訓練和部署比自身更強大的後繼系統，人類不再站在循環中。措辭是「有可能」。

這三種情境的排列順序與語氣分配構成了一道完整的敘事梯度。第一種被輕描淡寫，發揮了收納懷疑論者的作用；第二種以「證據」為基準，為文章披上理性的外衣；第三種則透過「有可能」與條件性的「如果技術趨勢持續」，將最大膽的假設推至讀者想像的邊緣，卻無需為其承擔舉證責任。

在整篇文章的最核心處，Anthropic 的態度被壓縮成了一句話：「我們還沒有到達那裡，遞歸自我改進也非不可避免。但它可能比大多數機構準備得更快到來。」

從「願暫停」到「單方面暫停只會讓魯莽者追上」

如果說 6 月 4 日的長文是一張精心構圖的快照，那麼把這張快照放進時間軸裡，能看到一條更長的軌跡。

在 2023 年，Anthropic 發布了負責任擴展政策（RSP）。這份政策文件的核心承諾是：如果模型的能力超出公司的安全控制能力，公司將暫停訓練更強大的模型。這不是口頭的表態，而是一份具有評估框架與觸發條件的內部治理文件。這份文件曾被 AI 安全界視為「自願性監管」的可操作範例。

在 2024 年，CEO Dario Amodei 發表了一篇廣為流傳的文章，提出「powerful AI」可能於 2027 年到來。當時，Anthropic 仍以安全派的獨立姿態示人，對規模化擴張和加速敘事保持著一張剋制的面孔。

2026 年 1 月 26 日，Amodei 於個人網站發表了一篇 38 頁的長文《The Adolescence of Technology》。文中寫下了一個此後被反覆引用的判斷：「由於 AI 目前正在撰寫 Anthropic 內部的大部分代碼，它已實質性地加速了我們構建下一代 AI 系統的進程。這個反饋迴路正逐月累積力量，可能距離當前一代 AI 自主構建下一代系統僅剩 1 到 2 年的時間。」在同一篇文章中，他將即將到來的「powerful AI」描述為「數據中心裡的天才國家」。

這幾乎是 Anthropic 開始系統性釋放「自我改進反饋迴圈正在發生」這一信號的起點。而這篇博文發布的時機，正好處於公司從 3500 億美元估值躍向更高估值區間的通道上。

不到一個月之後，轉折來了。

2026 年 2 月 25 日，CNN 報道，Anthropic 修改了其負責任擴展政策，移除了「若能力超出安全控制能力則暫停訓練更強模型」的核心承諾，代之以一個非約束性的「前沿安全路線圖」。同週，美國國防部長 Pete Hegseth 向 Dario Amodei 發出了最後通牒：撤回安全紅線，或失去 2 億美元的國防部合約。

報導引述了 Anthropic 首席科學官 Jared Kaplan 對《時代》雜誌的回應：「我們認為停止訓練模型實際上對任何人都沒有幫助……如果競爭對手正在全力衝刺。」這份回應中的措辭非常值得留意。「對任何人都沒有幫助」不是技術論證，而是一個利益相關者博弈的表述。「如果競爭對手正在全速衝刺」則在敘事架構上和「單方面暫停只會讓最不謹慎的參與者追上」完全同構：它把原來以自身安全能力為參照系的暫停邏輯，替換為以競爭對手行動為參照系的速度邏輯。

Anthropic 仍在 CNN 報導中強調保留了兩條紅線：不將 AI 系統用於控制武器系統，不用於大規模國內監控。這一點很重要，因為它表明 Anthropic 並非全盤放棄安全立場，而是在不同安全維度上做出了有選擇性的退讓和堅守。但這種選擇性本身也正是敘事策略分析中的一個核心線索：它在哪些方面退讓了，在哪些方面守住了，這個邊界刻畫了安全被重新校準的刻度。

3 月 11 日，Anthropic Institute 正式成立，由 Jack Clark 領導，定位為「公共利益研究機構」。不到兩個月後的 5 月 4 日，Clark 發出了那條「60%」的帖文。

一旦這個時間序列被並置，信號密度與釋放節奏便非隨機。從 1 月的個人文章預告，到 2 月的政策修改，到 3 月的機構成立，到 5 月的創始人概率預測，再到 6 月的官方長文發布，這是一條節奏清晰、措辭逐步升級的敘事管道。不能由此直接推導出「這一切都是提前策劃好的」，但這個序列本身構成了一個分析師必須面對的問題：這種節奏感是否說明，Anthropic 已經將「加速敘事」納入了它的公共傳播管理範疇？

哈薩比斯的有意挑釁

如果在 2026 年上半年只有 Anthropic 一家在調整口徑，分析師有足夠的理由將注意力集中在企業內部的決策邏輯上。但 DeepMind 執行長 Demis Hassabis 幾乎同步做出了方向一致的調整，使得「單一企業個案」的說法站不住腳了。

1 月 20 日，達沃斯論壇。Hassabis 仍維持他多年來的一貫判斷：AGI 在 2030 年有 50% 的機率。3 週後的 2 月 18 日，在印度 AI 影響力峰會上，他鬆口表示：“AGI 可能在五年內到來。”

5 月 20 日至 22 日，Google I/O。Hassabis 在主題演講中表示，人類正站在「奇點的山麓」。同一時期，OpenAI 發布了 GPT-5.3-Codex，稱該模型「在創建自身過程中發揮了關鍵作用」，具體包括輔助調試訓練過程、管理部署、分析評估結果。三家頭部實驗室在這個時間窗內的步調差被壓縮到以週計算。

Google I/O 之後，Hassabis 接受了 Axios 的採訪。這段採訪後來被大量引用，其中最關鍵的一句是，他承認使用「奇點的山麓」這類語言是「有意挑釁」，目的是激起政府、經濟學家和公眾對 AI 加速發展緊迫性的認知。他還將 AGI 時間線從此前「2030 年之後不久」調整為「2029 年是一個真實可能性」，儘管仍廣泛預期在 2030 年，正負一年。

Hassabis 對《首爾經濟日報》說得更直接：「五到十年後，當我們回顧 2026 和 2027 年時，我們會說‘那就是我們進入 AGI 時代的時刻’。」

「有意挑釁」這個詞值得反覆掂量。它是一個罕見的、由當事人親口說出的對敘事意圖的坦白。它承認，他所使用的至少一部分措辭，不是對技術事實的被動反映，而是主動選擇的傳播工具。這個坦白本身並不否定他可能也真的看到了技術拐點，但它明確地把「敘事」從「事實」的陰影裡拎了出來，讓它成為一個可以被單獨審視的客體。

哈薩比斯對自己措辭的自我解釋，打開了理解這輪同步信號的一扇側門。他的「有意挑釁」與 Anthropic 長篇數據論證中的「腳註免責」展現了同樣的兩棲姿態：一手推送足以震撼輿論的信號，另一手保留退回到「這只是一部分可能性」的安全空間。

同一組數據，完全不同的解釋

當 Anthropic 和 DeepMind 共同建構出「AI 正在加速自我進化」的敘事框架時，外部獨立研究者對同一組數據和現象提供了另一種解讀。這些解讀之所以重要，並非因為任何一方掌握了終極真相，而是因為它們揭示了官方敘事本身的可解釋範圍有多廣。

最尖銳的回應來自 Eliezer Yudkowsky。他不僅回覆了 Jack Clark，還在後續多個場合持續發聲。MindStudio 的博客記錄了他的完整態度：他以切爾諾貝利 RBMK 反應堆來類比當前 AI 系統的安全設計。這個類比的核心論點是，如果控制桿和加速器綁在同一個系統中，當你試圖減速時，系統實際上會更快失控。

Allen Institute for AI 的 Nathan Lambert 提出了「有損自我改進」（Lossy Self-Improvement，LSI）這一概念。他的論點直接挑戰了「加速飛輪」模型：當系統變得越來越複雜時，每一代的改進過程都會產生摩擦和損耗，就像訊號在長距離傳輸中會衰減一樣。根據這個邏輯，那些讓 80% 或 90% 代碼由 AI 撰寫成為可能的改進，並不能無限複製到下一代系統上，因為下一代會面臨更複雜的問題空間，而 AI 本身產出中的噪聲和誤差將在代際傳遞中被放大。

美國創新基金會高級研究員 Dean Ball 提供了一個更直接的語言框架，用以簡化 Anthropic 的數據。他對 IEEE Spectrum 說：「也許最終他們會自動化天才，但不是明年。明年他們自動化的是苦力。」這一區分精準地觸及了「80% 的代碼由 AI 撰寫」這一說法的核心歧義。如果 AI 自動化的是代碼庫中的固定模式、參數的批量生成、端到端的管道配置，那麼在軟體工程的語境中，這些工作確實僅對應「苦力」。剩下的 20%，則可能包含架構設計、方向判斷、基於不完整資訊的權衡，這些才是天才的部分。

蒙特利爾大學的 David Scott Krueger 作為 AI 安全非營利組織 Evitable 的創始人，他提出的暫停觸發紅線是「99% 代碼由 AI 撰寫」。他對 IEEE Spectrum 表示：「我認為我們現在可能正在跨越這條線。」他的框架與 Anthropic 自己已放鬆的暫停承諾之間的張力，正是這輪敘事中最重要的結構矛盾之一。

UBC 計算機科學家 Jeff Clune 在接受 IEEE Spectrum 採訪時則持相反觀點。他說：「我們正處於遞歸自我改進系統的拐點上。」如果他的這句話真的被驗證，則意味著 Yudkowsky 的警鐘敲對了節拍。

四組聲音，方向各不相同，甚至在同一方向上還有激進派的內部拉扯。但它們的共同點在於，它們都沒有依賴官方的敘事框架，而是各自從自身的方法論出發，對同一組現象給出了獨立的判斷。而這些判斷的多樣性和相互衝突本身，就是對「任何一個單一敘事足夠覆蓋全部真相」的最有力反駁。

估值曲線與敘事節拍的耦合

在 2026 年 1 月，Anthropic 完成融資，估值 3500 億美元。投資方包括微軟和英偉達。這個數字在 2025 年底已由部分媒體預熱，但正式落地的時點恰好在 Amodei 發布《The Adolescence of Technology》之後。

2 月，另一輪融資 300 億美元完成，估值維持在約 3500 億美元的區間。同月，安全政策修改，移除暫停承諾。五角大樓的 2 億美元合同威脅落下。

5 月，路透社、紐約時報和 TechCrunch 幾乎同時報導，Anthropic 完成了一輪 650 億美元的融資，估值達到 9650 億美元。這個數字不僅超過了自身兩個月前的估值，也超越了 OpenAI 在 2026 年 3 月的 8520 億美元估值。紐約時報另援引 Dario Amodei 在開發者大會上的說法，稱公司年化收入達到 300 億美元，他本人甚至開玩笑說「希望今年 80 倍的收入增長不要繼續，因為那樣太瘋狂了」。

6 月 4 日，Anthropic Institute 發布《When AI builds itself》長文。

將這些時間節點一字排開，並不代表暗示存在圖表上精確的箭頭指向。如果有人聲稱這些事物之間存在因果關係，必須提供直接證據。在沒有內部決策記錄的前提下，任何分析師都無法也不應做出此類斷言。

但另一方面，完全不觀察和記錄這些時間節點的對應關係，同樣是不合理的。一家企業在短短 5 個月內，從 3500 億美元估值攀升至 9650 億美元，翻了近三倍，同時經歷了一次重大的安全政策轉向，同時構建了一個由獨立研究機構主導的「加速信號」敘事管線，同時其聯合創始人给出了 60% 概率的預測。當所有這些事件密集地壓縮在 6 個月之內完成時，投資者至少有權利追問：這些信號釋放是否、以及在多大程度上承擔了向市場傳遞「我們身處加速前沿」這一信息的功能？

這個追問本身即是分析的價值所在。答案可能永遠不止一個。但問題一旦被清晰地提出，就不會再被輕易收回。

2026 年第一季，全球人工智慧市場的融資達到了 2970 億美元，前五大交易佔據了這筆總額的顯著份額。在這樣的水準下，所有前沿實驗室都面臨著同樣的壓力：你需要說服投資者，你的技術曲線將比對手更陡峭。你的風險警示也必須足夠響亮，以便當監管者最終進場制定規則時，你的聲音能提前被內建於政策框架之中。你的敘事，還必須同時足夠吸引頂尖研究者選擇你的實驗室，又足夠令人警覺，以維持你在安全社群中殘存的話語基礎。

這些需求之間存在內在矛盾。Anthropic 在 2026 年上半年的敘事調整，可被視為在語言層面上重新校準這些相互矛盾需求的平衡點。安全承諾的弱化、加速信號的強化，以及對「我們不能單方面停下」這一論點的反覆使用，共同構成了一組指向同一方向的向量。

信號已發出，然後

需要回到最核心的那個問題上：這些信號，到底更像是技術拐點的反映，還是面向資本與監管的修辭升級？

現有的公開證據不允許在兩個選項之間簡單地打勾。因為兩種解釋所使用的證據，實際上是同一組數據。80% 的代碼占比、52 倍的加速效果、每 4 個月翻倍的任務時長，既可以用來支持「拐點正在來臨」，也可以用來解釋「我們正在向市場傳遞一種我們自己的技術人員已親身經歷的趨勢感知」，這兩者之間的界線是模糊的。

但有一些事實是確定的，不需要在兩種解釋中選邊站隊。

第一，Anthropic 於 2026 年上半年完成的敘事轉向並非孤例。DeepMind 的 Hassabis 幾乎在同一季度做出了方向一致、程度不同但本質相同的調整，OpenAI 的 Sam Altman 在印度峰會上表示「世界還沒有準備好」，並於 2026 年 2 月發布了聲稱「在創建自身過程中發揮了關鍵作用」的 GPT-5.3-Codex。如果這只是 Anthropic 一家在釋放信號，或許可以從企業策略的角度進行分析。但三家前排實驗室在密集的幾個月內同時提高聲量，這就構成了行業層面的敘事轉向。

第二，這些信號釋放的節奏與融資、政策調整、機構重組的節拍之間，存在可被精確追蹤的時間對應關係。這種對應本身無需證明任何事，只需如實呈現。呈現之後，每個人自有的方法論會決定他接下來如何思考。

第三，Anthropic 自己為第三種情境，即「完全遞歸自我改進」，標註的狀態仍然是「有可能」，而非「很可能」。這意味著，在這家發布這些數據的公司自身的內部判斷框架中，他們的加速敘事尚未完全閉合。那些讓他們在學術論文和部落格撰寫中習慣性地加入限定詞的力量，仍然在拉住他們公開措辭的韁繩。

第四，哈薩比斯的「有意挑釁」自白，證實了一個此前雖被廣泛懷疑但很少由當事人親口說出的機制：至少部分前沿實驗室的領導人在選擇措辭時，懷著明確的傳播目的。這使得所有對他們聲明的解讀，必須同時包含兩個層面的分析對象，即他們聲稱的事實，和他們在選擇這些聲稱時所採用的修辭策略本身作為一個行為事件。

那些仔細閱讀了 Anthropic 全篇數據的人，與那些只記住「80% 代碼由 AI 撰寫」和「52 倍加速」這兩個數字的人，接收到的訊號強度完全不同。但在這件事上，「如何被記住」也許比「實際說了什麼」更應被當作分析對象。

這篇長文本身，就是它所描述的那種現象的一個精確樣本。它用數據建構出一種迫在眉睫的加速感，又透過腳註和限定詞保留了退後的餘地；它呼籲全球協調與可驗證的放緩，卻在先前的政策修改中已撤回了暫停承諾。這並非虛偽，也不是簡單的言行不一。這是一個機構在技術不確定性、商業壓力與公共責任之間的敘事平衡術。而 Hassabis 的「有意挑釁」自白，恰好從側門證實了這種平衡術在頂尖實驗室中已是一種被自覺使用的方法。