Anthropic,即 Claude AI 模型的背後公司,於 6 月 4 日發表了一篇部落格文章,提議整個產業應對前沿 AI 開發實施結構化且臨時的停頓,這在一年前簡直是從頂尖 AI 實驗室聽來無法想像的提議。
該提案由馬琳娜·法瓦羅和傑克·克拉克撰寫,針對一個具體且確實令人不安的問題。AI 模型正逐漸具備遞歸自我改進的能力,意味著它們可以在無人為干預的情況下修改和提升自身的功能。
Anthropic 真正提出的建議
這不是要你拔掉所有 GPU 回家。Anthropic 倡議建立一個協調的多邊框架,讓主要的 AI 實驗室同意暫時停止最先進的開發工作,以便安全研究和驗證系統能夠跟上進度。
Anthropic 明確指出,單方面行動——即一家公司或一個國家單獨踩剎車——是不夠的,甚至可能適得其反。該提案倡導美國、中國及其他擁有重要 AI 計畫的國家之間的資深實驗室進行合作。Anthropic 將驗證挑戰比擬為核武控制,檢察人員透過協議的偵測機制來驗證合規情況,而非僅依賴信任。
Anthropic 表示,它將自行開展研究,以建立這些檢測和驗證工具,創造出類似於 AI 武器檢查員的系統——這些系統能夠確認實驗室是否在公開聲稱遵守停頓的同時,秘密繼續前沿開發。
為何這次可能與 2023 年不同
2023 年,一封呼籲暫停訓練超越 GPT-4 水準的 AI 的公開信,獲得了數千名研究人員和科技界領袖的簽署。然而,這封信幾乎毫無成效。競爭壓力遠比集體焦慮更具說服力,各大實驗室都持續推進開發。
Anthropic 的提議在結構上有所不同。與其要求僅憑簽名支持的模糊暫停,該公司建議建立一個可驗證的合規系統。核武器控制的類比並非完全不當:國際軍備條約之所以有效,是因為有檢查機制和對違規行為的後果,而非僅靠簽署方小指拉鉤承諾。
在 2023 年,遞歸自我改進仍是一個理論上的關切。如今,Anthropic 內部的觀察顯示,現有模型越來越能自主編碼,逐漸接近 AI 系統能對其自身下一迭代產生有意義貢獻的臨界點。
這對投資者意味著什麼
對於任何持有與人工智慧相關資產(包括專注於人工智慧的加密貨幣代幣和運用機器學習的區塊鏈項目)的人來說,Anthropic 的提議為風險評估引入了一個新變數。即使協調停頓框架從未完全實現,也會將討論從「我們是否應該規範人工智慧」轉變為「我們如何在跨境範圍內執行合規」。
由人工智能驅動的加密貨幣項目,從去中心化計算網絡到AI代理代幣,其價值主張部分基於人工智能發展將持續加速且無中斷的假設。一個可信的暫停框架,或朝此方向的嚴肅監管行動,都可能為這些估值帶來不確定性。
去中心化的驗證系統可能成為 Anthropic 所尋求的解決方案的一部分。如果您需要驗證全球實驗室是否遵守開發限制,一個透明且防篡改的賬本並非最差的工具。
