美國政府要求 Anthropic 限制兩款高階模型 Fable 和 Mythos 的出口後,一批網路安全從業者公開反對這一決定,認為限制措施削弱了安全防禦方使用先進 AI 發現漏洞、修復缺陷和加固軟體的能力。
公開信目前已由 76 名網路安全專家簽署,簽署者包括前 Facebook 安全負責人 Alex Stamos、Bugcrowd 創辦人 Casey Ellis、密碼學專家 Jon Callas、電腦科學家 Paul Vixie,以及 Luta Security 創辦人 Katie Moussouris 等人。聯名信指出,在對手技術快速推進的情況下,將最強能力從防禦方手中撤走,是一種危險的做法。
政府下令後全球暫停存取
Anthropic 表示,美國政府上週以國安為由頒布出口限制,但未說明更具體的依據。公司隨後暫停了全球用戶對 Fable 和 Mythos 的訪問。
Mythos 於今年 4 月以預覽形式推出。當時 Anthropic 表示,該模型在發現安全漏洞方面能力強大,因此需嚴格限制存取,以防止被惡意駭客或外國對手濫用。最初僅有約 50 家公司有資格使用,之後擴展至 15 個國家約 150 家機構。
爭議集中在所謂的繞過方法
Anthropic 還提到,白宮的這項限制命令可能與一份報告有關。該報告稱,外界存在一種可繞過 Fable 限制的方法,從而釋放接近 Mythos 級別的能力。
Katie Moussouris 表示,這份尚未公開的研究由亞馬遜研究人員完成,她本人已閱讀過內容。她認為,論文並未展示真正意義上的「越獄」方法。按她的說法,研究人員只是要求模型修復包含公開漏洞和人為植入漏洞的開源代碼,而非成功突破模型原有的防護。
她指出,這類操作本身就是安全團隊的日常工作流程,包括發現問題、修復缺陷並驗證補丁是否有效。如果把這種能力視為繞過限制,結果只會讓模型在防禦場景中的價值下降。
聯名者稱問題並非 Anthropic 獨有
公開信還稱,相關方法並不只適用於 Anthropic 模型,OpenAI 的 GPT-5.5、Anthropic 已公開提供的 Claude Opus 4.8 和 Sonnet,甚至中國模型 Kimi 2.7,也可能出現類似情況。
聯名者同時呼籲,美國政府在制定相關規則時提高透明度,並透過更公開的程序推進,依據行業和學術界的研究結果,盡量把限制措施控制在最小範圍內。
