Anthropic 發布了新一代公開可用模型 Opus 4.8,並同步上線名為「動態工作流」的新功能預覽。新版本距離 Opus 4.7 發布僅 41 天,更新節奏明顯加快,也顯示出大模型廠商在產品迭代上的競爭正在升溫。
41 天完成一次升級
Opus 4.8 是 Anthropic 目前最先進的公開模型,定價與上一代 Opus 版本保持一致。與以往相比,這次升級間隔較短。作為對比,Anthropic 近期的 Sonnet 和 Haiku 系列距離上次更新已分別過去約 3 個月和 7 個月。
在這個時間窗口內,OpenAI 推出了與 Codex 相關的更新,Google 也發布了 Gemini Flash 的新版本。隨著外部競爭加速,Anthropic 需要更快推出新產品以回應市場。
強調減少無依據的結論
根據 Anthropic 的說法,Opus 4.8 仍以領先的基準測試表現為主,但這次更顯著的變化在於模型處理錯誤或不確定數據的方式。公司在發布說明中表示,早期測試者認為,Opus 4.8 更傾向於主動標記不確定之處,並更少做出缺乏依據的判斷。
橋水基金也在用戶評價中提到,新版本更容易主動指出分析輸入和輸出中的問題,而這類問題過去往往需要用戶自行發現。
動態工作流進入預覽
與新模型一同發布的,還有處於研究預覽階段的 Dynamic Workflows。該系統主要面向更複雜的任務執行,目標是幫助像 Opus 這樣的大型模型調度數百個並行子代理,完成大規模、多步驟工作。
Anthropic 舉例稱,Claude Code 配合 Opus 4.8 後,可以圍繞現有測試體系,完成覆蓋數十萬行代碼的遷移任務,從啟動到合併形成更完整流程。
Mythos 仍未全面開放
Anthropic 目前尚未正式推出更高階的 Mythos 模型。該模型在上月短暫預覽後,引發了網路安全方面的擔憂。
然而,公司在此次 Opus 4.8 發布中表示,相關安全防護正在加速推進,預計未來幾週可將 Mythos 級模型提供給更多客戶。
