智東西5月7日報道,今日凌晨,Anthropic 在開發者大會 Code with Claude 上連發數項重大更新:放寬開發者介面調用速率限制、Claude 托管智能體上線三大新功能、Claude Code 連續更新十餘項新功能,並與 SpaceX 达成重要合作。
首先,自即日起,Anthropic 將在 Pro、Max、團隊版及按席位計費的企業版套裝中,將 Claude Code 的 5 小時調用限額倍增至 10 小時;取消 Pro 和 Max 帳戶在高峰時段的配額削減限制;放寬 Claude Opus 模型的 API 速率限制。

Claude Opus 模型更新後的 API 速率限制
此外,Claude 托管智能體新增了多智能體編排、目標結果(Outcomes)以及自主推演(Dreaming)三大功能,其中 Dreaming 目前處於研究預覽版階段,需申請體驗;Outcomes、多智能體編排與記憶功能已作為托管智能體服務 Managed Agents 的一部分,開放公測。

Claude Code 新增遠端控制、UI 更新、無閃爍渲染、權限控制等多項新功能。
最後,為進一步擴大服務覆蓋範圍,Anthropic 已與 SpaceXAI(即更名後的 xAI)達成合作,將全權使用 SpaceXAI Colossus 1 數據中心的全部算力資源。這將使其在本月中新增超過 300 兆瓦的算力容量,超過 22 萬張英偉達 GPU,新增算力將用於提升 Claude Pro 和 Claude Max 訂閱用戶的服務承載與使用體驗。

此次算力擴容,是 Anthropic 一系列重大算力布局官宣的又一項重磅舉措。
此前,Anthropic 與亞馬遜達成最高 5 吉瓦算力合作協議,其中於 2026 年底前將落實新增近 1 吉瓦算力容量;與谷歌、博通簽署 5 吉瓦算力協議,相關算力將於 2027 年陸續投產上線;與微軟、英偉達達成戰略合作,涵蓋價值 3000 億美元的 Azure 雲算力資源;與 Fluidstack 聯手,向美國人工智慧基礎設施投入 5000 億美元建設資金。
今日凌晨4點,Anthropic 联合創始人兼執行長 Dario Amodei、Anthropic 聯合創始人兼總裁 Daniela Amodei 與 Anthropic 首席產品官 Ami Vora 進行了對話。
Dario 表示,得益於 Claude,這是全世界首次如此關注 Anthropic。Anthropic 的 ARR 增長速度呈指數級上升,此前他們認為這一數字可能會逐步增長至 10 倍,但最終看到了 80 倍的增長,他們正以盡可能快的速度提供比以往更多的算力。但他也提到,希望漲勢不要繼續下去,那樣太離譜,根本招架不住。

Anthropic 首席產品官 Ami Vora、Anthropic 聯合創始人 Daniela Amodei、Anthropic 聯合創始人兼 CEO Dario Amodei(從左至右)
01. Claude 托管智能體升級,AI 學會自我複盤進化
Anthropic 此次為 Claude 托管智能體升級的三項能力包括:
首先是多智能體編排能力,開發者可以組建智能體叢集,協同完成超高複雜度的任務。
其次是目標結果(Outcomes)功能,其允許開發者精準定義任務的成功標準,Claude 會自動反覆迭代,直到任務完成達標。
最後是自主推演(Dreaming)能力,借助 Dreaming,Claude 能夠實現自主規劃任務。它能夠主動復盤過往會話記錄,梳理自身欠缺的能力與本該吸取的經驗教訓,並自主將這些沉淀直接寫入記憶中。

Anthropic 產品主管 Angela Jiang 和工程師 Katelyn Lesse 基於 Claude 托管智能體,在現場自創了一家 Lumara 創企,並為這家創企開發了一套基因算法軟體,實現無人機在月球的自主著陸。
他們先設定了一個假想情境,有一位客戶希望在月球投放無人機,開採某種假想礦產資源,然後透過 Claude 命令列工具演示了具體配置流程。
首先,Lesse 介紹了需要協同完成工作的多個智能體:總指揮智能體的核心職責是保障整個任務全程順利推進,探測智能體負責篩選出蘊藏高品質礦產資源的適宜著陸地點,導航智能體確保無人機安全著陸,並精準飛往指定目標位置。

在整個任務運行期間,總指揮智能體將啟動一個任務會話,各個子智能體均擁有獨立的執行緒,並配備專屬的上下文窗口。
接下來,基於目標結果(Outcomes)功能,已配置一高階智能體,專門負責確保最終達成預設目標。可以看到,以下這份簡潔的 Markdown 檔案清晰列出了判定任務是否成功的各項標準:要求無人機平穩軟著陸;必須降落在平整無障礙的地面;預留充足備用燃料,確保無人機能安全返航地球。

為設定任務目標的這套評判標準,演示人員向任務會話發送一個事件,將這套評判規則定義為其目標驗收標準。
此外,在任務執行過程中,他們還會單獨建立一個評分審核智能體。該智能體會在對話中全程進行評估,判斷每輪執行是否符合預先設定的驗收標準。開發者也可自行設定允許的最大迭代次數。
接下來進入測試階段,客戶提供了六個假想著陸點的相關數據,他們將運行多輪模擬會話以測試實際效果。在 Lumara 的後台控制面板中,其已針對六個著陸點完成模擬運行,測試結果顯示,其中有四個判斷正確,但三號和四號站點還有優化空間。

下一步將對這套系統進行升級優化,演示人員進入 Claude 開發者控制台,打開 Dreaming(自主推演)功能介面,點擊標有 Dream 的按鈕,再選擇一個記憶存儲庫。隨後自主推演智能體將復盤過往所有模擬對話,並將總結出的經驗寫入記憶庫。後續所有新任務對話,都能引用這些沉淀下來的經驗。

更重要的是,該智能體還會自動生成一套著陸操作手冊。往後所有新的任務會話,都可參照這份手冊執行,其中收錄了從過往各次任務中總結出的各類經驗規則。
02. 推出 10 項以上更新,專注於用戶友好與自主智能
Claude Code 工程師 Dickson Tsai 介紹了 Claude Code 在兩大方向上的十餘項更新。
第一大方向是關於開發者體驗:如何讓開發者在日常使用 Claude Code 時更順手、更友好。
遠端控制(Remote Control):用戶可將任務留在電腦端後台運行,外出時用手機繼續延續同一會話、同一開發環境。

無閃爍渲染(Flicker-free Rendering):其舊版採用向現有視圖追加內容的方式,視圖錯位會觸發頻繁重繪,如今終端 UI 支援全屏模式,並採用了虛擬列表渲染技術。通過這種優化,其可以消除介面卡頓閃動,讓終端裡的程式碼元素支援點擊互動;即便面對超長會話日誌,也能把記憶體佔用維持在平穩水平。
在 Claude 運行過程中,開發者可以直觀地看到渲染效果。即使是超長內容,也不會出現渲染花屏或錯亂等問題。

UI 更新:新增篩選與分組功能,可按項目和任務進行分組管理。開發者還可透過拖曳方式自由開啟各類面板,支援多種視圖佈局隨意切換。
開發者現在可直接跳轉至對應環節的規劃概要,隨時留下批註,所有批註將由 Claude 統一彙總並跟進處理。除了規劃視圖外,開發者還可切換其他視圖,並在對應位置直接批註留言。最後,開發者可直接打開工作目錄中的任意檔案,快速進行編輯修改。
當會話日誌很長時,開發者可以把滑鼠懸停在任意一條訊息上。然後為會話中的任意一條訊息自訂標題,即可在頂部自动生成目錄大綱。

第二個主題是自主智能(Autonomy)。
Auto Mode 模式:Claude 可自主執行權限授權提示、建立分支、執行建置命令等瑣碎操作,Claude 現在可自行全權處理。
Claude Code 新增了權限模式:透過安全分類器,由 AI 替開發者自動做出權限決策。分類器主要核查兩點:一是該操作是否具有破壞性風險;二是是否存在提示注入特徵。如果判定工具呼叫安全,便直接放行自動執行;如果存在風險,則會攔截操作,等待開發者手動確認授權。
Worktrees:可幫助開發者徹底隔離各項工作,保持程式碼環境乾淨獨立。原生 Git 工作樹存在許多使用痛點與邊界問題,Anthropic 已對其進行優化打磨,開發者可享有更友好易用的操作介面。

自動記憶(Auto Memory)功能:Claude 可跨會話累積知識,記住關鍵建構指令、調試心得、專案偏好設定等資訊。Claude 會自動判斷這些資訊是否對未來對話有用,從而決定是否保存。

多階段、多智能體程式碼審查功能:系統將啟動一組審查智能體,分別從不同維度獨立審查程式碼,並對所有審查結果進行核驗確認。這套機制能揪出許多原本需要花數小時才能排查的問題,

任務例行程序(Routines):此功能已開啟預覽版,使用方式為:只需一次性設定提示詞、程式碼倉庫和相關連接項目,再選擇定時 Cron 任務、每日固定執行、GitHub Webhook 事件等觸發方式,即可由 Claude 全自動運行。

最近的更新還包括下圖所示:

03. 明確三大未來研發方向,架構設計需面向下一代模型
Dianne Penn 表示,Anthropic 已推出 18 個版本的 Claude 模型,包括 Sonnet、Opus 以及全新的 Mythos 系列,均已對所有開發者開放。
過去一整年,他們陸續向開發者推出了八款前沿大模型。模型的指數級發展意味著模型的智能程度正變得更有邏輯、更有規劃性、思考更縝密。

未來的開發者將擁有主動式、全天候在線的智能體,它們清楚該做什麼工作,且全程邏輯連貫、不會偏離思路。所有人使用和基於 Claude 模型開發的方式,也必須隨之改變。
因此,Anthropic 內部認為,架構設計應面向下一代模型,而非僅適應當前版本。最終勝出的開發者都會提前優化自身架構,為迎接下一次智能能力躍遷做好準備,而非只盯著當下小幅的性能迭代。這要求業界需持續制定並搭建更高標準的評測體系,大膽開發如今看似無法運行的前沿原型。
對於企業而言,主要有兩大核心難題:能拿到符合預期的輸出結果,以及讓業務快速上線、快速交付。
The Claude platform was built for this purpose, featuring API foundational primitives specifically fine-tuned for Claude models. It provides enterprises with the underlying infrastructure to build and scale agent systems, along with a comprehensive set of management capabilities for operating and maintaining these systems.
Angela 表示,企業最常遇到的問題是,他們非常需要高階智能能力,卻很難落地應用。Anthropic 提出的解決方案之一就是諮詢策略能力。
企業只需在 Messages API 中更新工具陣列設定即可。
具體而言,他們為企業提供了一套代理架構,將執行環節與決策顧問環節分離。在執行任務時,企業可選用輕量級小模型,成本更低。當此小模型需要決定下一步該如何操作時,可隨時調用更大的模型以獲取指導建議。

在實際落地中,企業可使用輕量模型負責任務執行,再由 Opus 高端模型擔任決策顧問。他們在實測使用 Sonnet 執行、Opus 做顧問的組合方案時,整體表現遠超單獨使用 Sonnet 模型,且整套方案的使用成本比單獨只用 Sonnet 更低。

04. 結語:模型、算力、商業化三管齊下,Anthropic 拚了?
當前大模型的競爭日趨激烈,Anthropic 也透露了其正在研發的方向與未來規劃:
首先是更強的判斷力與更高質量的代碼能力,開發者可以讓 Claude 處理自主工程開發任務;
其次是高質量記憶能力,打造更長上下文窗口,讓開發者可以持續開展長週期複雜任務,同時獲得更佳輸出效果;
最後是多智能體協同能力,可組建智能體團隊協同作業,多個 Claude 實例圍繞複雜目標分工協作完成複雜任務。
當前,大型模型企業正全面轉向算力基礎設施、模型、生態與商業化的綜合實力競爭。此次Anthropic不僅升級了自家產品,還官宣了與SpaceX的重磅合作,再結合亞馬遜、谷歌、微軟的算力,使其整體算力儲備與行業競爭對手的差距持續拉大。與此同時,隨著API價格下調與調用限額同步提升,Anthropic產品的綜合性價比凸顯,有望吸引大量中小企業客戶從其他大型模型平台加速遷移至Claude生態,進一步鞏固其在企業級AI市場的份額。
本文來自微信公眾號「智東西」(ID:zhidxcom),作者:程茜,編輯:李水青
