實現 Coding Agent 向通用場景的泛化是系統級競爭。
文章作者、來源:窄播AI
對於AI領域而言,本週是重磅消息不斷的一週。從黃仁勳重新定義AI PC,到微軟Build 2026喊出「Agent優先」,OpenAI宣布合併ChatGPT和Codex,再到微信Agent進展曝光、千問開始接入第三方Skill、豆包回應付費傳聞、美團財報會上強調服務AI Agent正變得越來越重要。
此前有人問過,曾經爆紅的 OpenClaw 怎麼沒人提了?本周傳出的這些消息以實際行動回答了這個問題——大家不再提 OpenClaw,是因為 Coding Agent 已成為一種執行任務的通用方案,並與 Chatbot 趨於融合,同時與之相匹配的 Skill 和 Agent 生態也開始建設,新的付費探索也正在進行中。
大型企業正在將 OpenClaw 帶來的啟發轉化為實際的業務進展。在這個過程中,OpenClaw 以及我們目前看到的產品,可能都並非 AI 產品的最終形態。正如騰訊首席 AI 科學家姚順雨在 2026 腾讯云 AI 產業應用大會上所說,一場長週期的變革才剛剛開始,真正的产品形態、商業機會和使用方式,都還遠未被充分發明出來。
我們能確定的是,Agent 正在成為大廠 AI 的核心戰場,而這場競爭的形態,正沿著四條主線不斷演變:誰能拓展更多生產力場景的用戶;誰能更深度打通內部產品;誰能建立起足夠豐富的 Skill、Agent 生態;誰能累積足夠的上下文。
「同事」成為 Agent 的競爭焦點
「同事」是當下描述 Agent 時最常被提及的詞彙。微軟的 Scout 被設計成「像同事一樣」工作;扣子 3.0 強調讓人和 AI 團隊一起協作;OpenAI 推出的 Agent 插件則被形容為「已辦完入職、懂全套流程的新同事」。
這些表述意味著,生產力場景已成為大廠 Agent 的競爭焦點。
微軟推出的 Scout 是基於 OpenClaw 框架打造的 Agent,常駐 Microsoft 365,可在 Teams 中運行,能與 Outlook、OneDrive 等辦公應用協同,瀏覽郵件、日曆、工作訊息,自動處理會議衝突、起草回覆、推進任務。同時,微軟還推出了 Agent 365,為企業統一管理 Agent 的身份、權限、策略和風險。
OpenAI 則將發佈會的主題直接定為「Intelligence at Work」。在這場發佈會上,OpenAI 為 Codex 進行了三項核心升級:推出可定製能力的 Agent 插件;將局部批註修改能力從程式碼和網頁,擴展至文件、表格和 PPT 上;透過生成網站進行產出彙報的能力。
同時,豆包在回應有關付費功能時提到,為滿足專業人士的生產力需求,豆包計劃推出豆包專業版,將包含軟體開發、數據分析、專業設計、流程自動化、金融分析、科學研究等專業服務。

這些產品行動表明,生產力場景——而不僅僅是傳統意義上的企業場景——的巨大價值已得到真金白銀的驗證。
OpenAI 發布的數據顯示,自今年 2 月以來,Codex 的週活躍用戶增長了 6 倍,達到 500 萬,其中知識工作者的增長速度是開發者的 3 倍。Anthropic 預計第二季度收入將增長一倍以上,達到 109 億美元,並可能實現 5.59 億美元的營業利潤,其收入主要來自企業和初創公司。
內部產品的整合與連接正在不斷深化
產品的更新與迭代,對應的是更深層的產品架構重組。一方面,目前各大廠基本都已佈局 Chatbot 和一個或多個 Agent 產品,現已開始針對這些產品進行整合。其中最激進的是 OpenAI 對 ChatGPT 和 Codex 的整合。
OpenAI 希望將 ChatGPT 從單純的對話入口,升級為協同 Agent 工作的主界面,而 Codex 則會升級為能夠滿足辦公、科研、企業流程、數據分析、業務運營等多場景工作需求的通用 Agent 平台,其核心在於將 Coding Agent 的使用場景泛化。透過這場整合,OpenAI 期待將 Codex 推廣至 ChatGPT 的龐大用戶群體,擴大付費用戶基數。
此外,有消息指出,OpenAI 計劃讓 AI 瀏覽器 Atlas 也參與到這場超級 AI 應用的整合中。
另一方面,大型企業原有的互聯網產品能力和服務,正快速以 Skill 或 Agent 的形式整合至 AI 產品中。阿里為通義千問增加點外賣、叫車、淘寶購物等功能,是較早期的探索。如今,我們可以看到字節、美團、騰訊都在進行類似的工作。
字節在打通豆包與抖音商城後,又開始增加對美食、電影票、民宿等本地生活服務的門店及團購套餐推薦。美團在財報會上表示,AI助手「小團」已嵌入美團APP,五一期間服務了超過1億人次用戶,覆蓋飲食娛樂、出行、問診等場景。騰訊文檔也將過往累積的文檔處理能力轉化為Skill,供WorkBuddy調用。
騰訊集團高級執行副總裁湯道生在2026騰訊雲AI產業應用大會期間表示,過去許多傳統應用的功能,需轉換為可被智能體調用的能力,才能進一步釋放多年累積的價值。因此,今年企業微信已將原本的一些數據能力透過介面、透過Skill開放出來,讓其他智能體可以調用。這種開放的趨勢越來越明顯。
第三方生態建設已開始提上日程
Agent 與此前產品的一個核心差異在於,它具備工具調用的能力。這就要求 Agent 背後能夠有一個足夠豐富的工具生態。即便是大廠,也難以憑一己之力構建起這個生態。這就需要第三方的 Skill 或 Agent 生態建設。
The construction of this ecosystem has now been put on the agenda.
千問在完成對阿里內部第一方產品與服務的整合後,宣布將全面向第三方 Agent 和 Skill 開放,讓所有企業均可在千問上運營自己的品牌 Agent。本週,瑞幸、肯德基、蜜雪冰城、東方航空已在千問上線 Skill。隨後,企業還可在千問中自定義 Agent 人設與具體服務。
騰訊一方面將美團的小美接入至元寶,為用戶提供外賣點餐、配送等服務;另一方面正加速微信 Agent 生態的建設。
媒體報導顯示,微信的 Agent 已完成原型測試,最快將於本月啟動公開上線前的合規審批流程。這個 Agent 能調度微信小程序,實現點餐、打車、訂票、購物及本地生活等複合服務。
此外,微信還在嘗試與榮耀、小米等手機廠商建立 Agent to Agent 的連接,讓自身的基礎能力能被手機廠商的 Agent 調用。也就是說,手機廠商也將成為微信 Agent 生態的新入口,形成多個入口共用一套 Agent 生態的架構。
OpenAI 的 Agent 插件能夠一次性打包崗位所需的工具、知識和技能。例如,創意生產插件可根據 brief 生成 campaign board、展示廣告變體、產品生活方式圖和電商圖集,並能調用 Figma、Canva、Shutterstock、Picsart、Fal 等工具。簡單理解,這就是一套為 Agent 準備的職業傳承體系。

目前 Codex 的 Agent 插件涵蓋了 62 個熱門應用和 110 項技能。後續,OpenAI 希望將插件生態開放給合作夥伴,讓第三方直接在 Codex 和 ChatGPT 中創建並部署自己的插件。
上下文變得更為重要
姚順雨表示,模型越來越擅長將複雜輸入轉化為輸出,但前提是它能獲得足夠優質的輸入。這需要在用戶端為模型和 Agent 提供足夠詳實、有用的資訊,讓模型和 Agent 能理解「你是誰」「你正在做什麼」「什麼答案對你有價值」等能鎖定正確路徑的問題。
在開發端,圍繞 AI 產品開發,也需要有充分的上下文溝通。姚順雨和湯道生在上述活動的對談中提到,AI 產品開發需要從產品反饋中去確定模型應該獎勵什麼、懲罰什麼,什麼回答算好,什麼行為算差。這意味著,模型團隊和產品團隊需要通過一個上下文共享的過程,完成 Co-Design,共同創造出更好的體驗。
因此,AI 產品在用戶端需連接並累積多源的上下文資訊,再透過判斷哪些資訊該提供、哪些資訊不該提供,以與 Agent 對齊任務意圖;在開發端則需建立流暢的回饋機制,使模型團隊與產品團隊的開發目標對齊,加速體驗優化。
無論是用戶端上下文的累積,還是開發端上下文的共享,都不僅是開發問題,更是組織問題,需透過協同來實現上下文的累積與共享。
這也是為什麼 OpenAI 從今年 1 月開始重組團隊,讓產品團隊與負責相關底層模型的研究人員更緊密合作;隨後又將 ChatGPT、Codex 和 API 團隊整合為一個部門,由 Thibault Sottiaux 負責。
同時,對上下文的重視,還可能推動硬體的代理化,使硬體成為代理收集用戶上下文的有效途徑。微軟的 Project Solara 項目正在進行此類探索。隨時隨地的溝通並非開發代理桌面終端和隨身設備的唯一目的,更多目的是在桌面和移動場景中為代理執行任務提供更多上下文資訊。
過去幾年,AI 行業呈現出一條相對清晰的技術路徑:預訓練→後訓練→Agent→Coding Agent。這條路徑可能不是未來唯一的主線,但卻是大廠當下能抓住的最有效主線。
我們提煉出的四個趨勢,是固定路徑走向的層層相連的基礎坐標,最終都是為了實現 Coding Agent 向通用場景的泛化。這又是一場系統級的競爭。
