- Anthropic 於 6 月 30 日美國出口管制結束後,全球恢復了 Fable 5。
- 新的安全措施現已阻止超過 99% 測試案例中的報告繞過行為。
- Anthropic 與 Project Glasswing 的合作夥伴正在建立一個共同的框架,以評估 AI 越獄行為。
Anthropic 已在美國政府解除臨時限制出口管制後,恢復了其 Claude Fable 5 模型的全球存取權限。該公司表示,於 6 月 12 日實施的管制措施要求其暫停存取,因為無法即時驗證用戶的國籍。
自6月30日起,隨著限制解除,Fable 5 現已於 Claude 平台、Claude.ai、Claude Code 和 Claude Cowork 上提供,而 Mythos 5 的存取權限也已恢復予有限數量獲批准的美國機構。
在恢復的同時,Anthropic 詳細說明了新的網路安全防護措施,提出了關於 AI 越獄的行業共享框架計劃,並描述了與美國政府機構的擴大合作。
兩週暫停後解除出口管制
Anthropic said Fable 5 和 Mythos 5 於 6 月 9 日推出,使用相同的底層模型,但各自設計目的不同。Fable 5 發布時為一般用戶提供了更強的網路安全防護,而 Mythos 5 僅提供給參與防禦性網路安全的 Project Glasswing 選定合作夥伴。
出口管制是在一份描述繞過 Fable 5 某些安全措施方法的報告之後實施的。根據 Anthropic 的說法,與政府機構和合作夥伴進行的測試發現,多個其他 AI 模型能夠識別報告中提到的相同軟體漏洞,且每個被測試的模型都能生成用於利用單一漏洞的相同示範。
Anthropic 表示,所報告的行為並未暴露 Mythos 5 獨有的能力,而是涉及一項作為 Fable 5 的預防性安全措施而被阻止的網路安全任務。
新的保障措施與行業協作
為應對所報告的繞過行為,Anthropic 推出了更新的安全分類器,在超過 99% 的測試案例中阻止了該技術。當請求被阻止時,用戶將被重定向至 Claude Opus 4.8。公司補充表示,在進一步優化期間,更新的系統可能在常規編程和除錯任務中增加誤報率。
此外,Anthropic 表示正在與 Amazon、Microsoft、Google 及其他 Project Glasswing 合作夥伴共同開發一個評估 AI 越獄的通用框架。該建議系統將根據能力提升、能力廣度、武器化難易度和可發現性來評估越獄,以幫助判斷新發現技術的嚴重性。
相關:美國允許 Anthropic 的 Mythos AI 恢復上線,而特朗普威脅徵收 100% 關稅
免責聲明:本文所載資訊僅供參考及教育用途,並不構成任何財務建議或任何形式的建議。Coin Edition 對因使用本文提及的內容、產品或服務而產生的任何損失概不負責。讀者在採取與本公司相關的任何行動前,應謹慎行事。
