字節跳動、阿里巴巴、騰訊擴大雲服務中的模型聚合

字節跳動火山引擎方舟 Coding Plan 近日正式上線 GLM-5.1，官方表示「對齊原廠滿血能力，不限購」。在此之前，火山的 Coding Plan 長期僅有 GLM-4.7 等較老模型。此次更新不僅引入了 GLM-5.1，同時整合了 Minimax M2.7、Kimi k2.6、DeepSeek-V3.2 等多款最新國產大模型。

Kimi

這意味著，開發者只需支付一份訂閱費用，即可同時調用多家頭部模型。根據市場反饋，這種「打包模式」大幅降低了開發者的試錯成本。目前 Lite 套餐價格為每月 40 元，Pro 套餐價格為每月 200 元，讓不少開發者願意「先買個占坑」。

智譜 GLM-5.1 在 2026 年 4 月初的一次更新中，已展現出令人印象深刻的工程能力。在智譜發布的兩個官方影片中，“8 小時從零構建 Linux 桌面”、“655 輪迭代，將向量資料庫的查詢吞吐提升到初始正式版本的 6.9 倍”，重新刷新了大眾對於大模型“8 小時有效執行”的想像。

記者實探開發者社區，多數用戶表示「不耐用」

記者進入一個方舟 Coding 開發者交流群，發現除了用戶分享體驗感受的帖子外，大量用戶反映實際體驗與預期存在落差。刷幾頁交流社區便會發現，投訴和申請售后退款的帖子非常多，不少網友直呼「感覺被騙」。

Kimi

爭議主要有兩點：

一個是關於限額使用過快的問題。一位名為「哈基米」的用戶發帖稱「一個任務幾輪對話 5 小時限制就快用完了」，還有另一位網友發布了自己「5 小時限額觸發的原因」是因為賬號在連續 5 小時內連續滑動窗口，實際請求數已超過 6004 次，超過了系統限額。

Kimi

二是由於算力調度承壓導致體驗下降。大量用戶反映遇到 429 錯誤（請求過多），以及高峰時段「首字延遲 1 分鐘以上是常態」。有用戶直言：「5 小時限額觸發太頻繁，無法用於正經開發。」

與此同時，在 Coding Plan 每月 40 元的低價背後，也隱藏著套餐內關於「一次調用請求」引向不同抵扣係數的「暗流」。例如，一位用戶在開發者交流群中發布了「調用不同模型抵扣係數差異」的圖片。例如，豆包全系列、Qwen 系列的抵扣係數為 1 次，DeepSeek 系列為 2 次，MiniMax-M2.7、Kimi-K2.6、GLM-5.1 系列為 5 次。

Kimi

這也反映出，搭建「模型超市」並沒有想像中容易，開發者雖被「性價比」吸引而來，但初期暴露出的算力調度等短板，卻讓許多開發者嘗試後選擇卻步。這也暴露了「打包模式」初期的陣痛。隨著用戶的涌入，算力平台的承載能力面臨挑戰。如何在低價吸引與服務質量之間找到可持續的平衡點，將是火山引擎及跟進者需要解決的長期命題。

雲供應商集體轉向「模型超市」，分層固化初現

火山引擎 Coding Plan 的這次「整合式」更新，也並非孤立事件。

自2026年初以來，阿里雲、百度智能雲、騰訊雲等主流雲廠商均在推進多模型整合佈局。例如，阿里雲作為行業先行者，較早推出多模型訂閱套餐「百煉Coding Plan」。目前支援通義千問系列及 kimi-k2.5、glm-5、MiniMax-M2.5 等模型。目前 Pro 套餐價格為每月 200 元，Lite 套餐自 3 月 20 日起已停止新購，4 月 13 日起停止續費與升級。

Kimi

騰訊雲大模型 Coding Plan 訂閱服務將於 2026 年 3 月全面上新，支援 Tencent HY 2.0 Instruct、GLM-5、Kimi-K2.5、MiniMax-M2.5 等多個最新模型。百度千帆於 2026 年 2 月正式推出 AI 編碼訂閱服務 Coding Plan，也是國內較早推出此類服務的雲廠商之一。

“模型超市”模式並非僅為一家之選，而正成為雲廠商競相布局的賽道。但撕開雲廠商聚合策略的外衣，誰能提供更穩定的服務、更透明的額度規則、更靈活的容災機制，誰能在程式設計之外，延伸出更多企業級服務能力，續費率能否跟得上，都成為新的競爭核心。

在國際上，亞馬遜 Bedrock、微軟 Azure 的模型聚合服務平台，與國內的 Coding 訂閱模式場景不同，但同屬整合趨勢。

Kimi

Overall, industry competition has shifted from a battle of “single model capabilities” to a competition of “platform integration capabilities + ecosystem service capabilities,” and industry concentration will rise rapidly.

國信證券首席資產配置分析師王開告訴記者，雖然行業分化正在加速，但判斷整合期可能為時稍早。「更準確地說，這是產業鏈分工的細化和迭代。模型廠商專注於算法，雲廠商專注於工程交付，各自發揮主業優勢。」他認為，無論其他雲廠商是否跟進，競爭格局都將從單打獨鬥向生態位分化演變。

大型模型公司「管道化」壓力加劇？

所謂「管道化」，並非指模型公司消失，而是指其喪失產品溢價、用戶連接權與話語權，利潤向算力平台方轉移，成為「被支配」的角色。

Under the tide of aggregation by cloud providers, “commoditization” is becoming the Sword of Damocles hanging over independent large model companies. In this silent struggle, leading players such as Zhipu AI, Moonshot AI (Kimi), and MiniMax have not chosen to passively compromise, but instead have grown from their core DNA, charting distinct paths to breakthrough.

智譜AI 執行長張鵬在 4 月 8 日的公開對話中明確表示，智譜的終極目標從來不是成為一款「可被隨意替換的調用工具」，而是構建全自治智能體（Autonomous Agent）。這一定位試圖讓智譜從「模型供應商」升級為「任務執行者」，從而繞過純 API 管道的低價陷阱。

月之暗面（Kimi）則採取「分散佈局＋深耕長文本」的策略。同步接入火山引擎、阿里雲等多家主流雲平台，實現算力多源供給、不被單一渠道綁定，保障服務穩定性與成本可控。2026年4月推出的Kimi K2.6 採用混合專家（MoE）架構，標準上下文視窗達256K tokens。

MiniMax 則將核心資源投入內容創作、智能客服、教育、企業服務、娛樂社交等垂直領域，尤其在遊戲 AI、數字人、多模態交互等場景重點布局，打造「雲平台難以替代的定制化能力」。

Kimi

大型平台的整合會加速模型公司被「管道化」嗎？國信證券首席資產配置分析師王開認為，需區分長短期視角。

「從短期來看，分發渠道由平台掌控，定價權部分讓渡，模型廠商的利潤向入口方轉移是商業規律。但長期而言，通用模型容易同質化，金融、醫療、法律等垂直場景的深度學習模型，專業壁壘不是集中聚合就能抹平的。」他認為。

在應對平台化風險方面，還可參考 OpenAI 和 Anthropic 的策略，一方面強化直面終端用戶的渠道，例如 ChatGPT 與 Claude 的獨立運營本質是在建立繞過平台的用戶連接。另一方面，技術迭代速度與用戶品牌認知是兩條有效護城河，因此模型公司需要兼顧研發投入與產品化佈局。

這場「管道化與平台化」的博弈終局，可能不是誰吃掉誰，而是分工的進一步清晰。雲廠商做管道，模型公司做技術，雙方在博弈中逐漸找到各自的生存邊界。

至於誰吃掉誰，在目前這個階段，還遠未到故事的結局。

本文來自微信公眾號「科创板日報」，作者：王耐