Anthropic 提議全面暫停人工智慧發展，以評估風險

Anthropic，即 Claude AI 模型的背後公司，於 6 月 4 日發表了一篇部落格文章，提議整個產業應對前沿 AI 開發實施結構化且臨時的停頓，這在一年前簡直是從頂尖 AI 實驗室聽來無法想像的提議。

該提案由馬琳娜·法瓦羅和傑克·克拉克撰寫，針對一個具體且確實令人不安的問題。AI 模型正逐漸具備遞歸自我改進的能力，意味著它們可以在無人為干預的情況下修改和提升自身的功能。

Anthropic 真正提出的建議

這不是要你拔掉所有 GPU 回家。Anthropic 倡議建立一個協調的多邊框架，讓主要的 AI 實驗室同意暫時停止最先進的開發工作，以便安全研究和驗證系統能夠跟上進度。

Anthropic 明確指出，單方面行動——即一家公司或一個國家單獨踩剎車——是不夠的，甚至可能適得其反。該提案倡導美國、中國及其他擁有重要 AI 計畫的國家之間的資深實驗室進行合作。Anthropic 將驗證挑戰比擬為核武控制，檢察人員透過協議的偵測機制來驗證合規情況，而非僅依賴信任。

Anthropic 表示，它將自行開展研究，以建立這些檢測和驗證工具，創造出類似於 AI 武器檢查員的系統——這些系統能夠確認實驗室是否在公開聲稱遵守停頓的同時，秘密繼續前沿開發。

2023 年，一封呼籲暫停訓練超越 GPT-4 水準的 AI 的公開信，獲得了數千名研究人員和科技界領袖的簽署。然而，這封信幾乎毫無成效。競爭壓力遠比集體焦慮更具說服力，各大實驗室都持續推進開發。

Anthropic 的提議在結構上有所不同。與其要求僅憑簽名支持的模糊暫停，該公司建議建立一個可驗證的合規系統。核武器控制的類比並非完全不當：國際軍備條約之所以有效，是因為有檢查機制和對違規行為的後果，而非僅靠簽署方小指拉鉤承諾。

在 2023 年，遞歸自我改進仍是一個理論上的關切。如今，Anthropic 內部的觀察顯示，現有模型越來越能自主編碼，逐漸接近 AI 系統能對其自身下一迭代產生有意義貢獻的臨界點。

對於任何持有與人工智慧相關資產（包括專注於人工智慧的加密貨幣代幣和運用機器學習的區塊鏈項目）的人來說，Anthropic 的提議為風險評估引入了一個新變數。即使協調停頓框架從未完全實現，也會將討論從「我們是否應該規範人工智慧」轉變為「我們如何在跨境範圍內執行合規」。

由人工智能驅動的加密貨幣項目，從去中心化計算網絡到AI代理代幣，其價值主張部分基於人工智能發展將持續加速且無中斷的假設。一個可信的暫停框架，或朝此方向的嚴肅監管行動，都可能為這些估值帶來不確定性。

去中心化的驗證系統可能成為 Anthropic 所尋求的解決方案的一部分。如果您需要驗證全球實驗室是否遵守開發限制，一個透明且防篡改的賬本並非最差的工具。