字節跳動 2026 年 AI 战略聚焦於世界模型、Seedance、編程與 DouBao 商業化

字節跳動 2026 年 AI 戰略聚焦四大方向：世界模型、視頻模型 Seedance、Coding 和豆包商業化。

文章作者：周鑫雨

文章來源：36氪

《智能湧現》從多個信源處獨家獲悉，2026 年，字節 AI 有四個重要的命題：

加大對世界模型訓練的投入，年底前，模型性能達到現階段世界模型全球 SOTA（最佳）Google Genie 3 的水平。

Video models continue to lead the way, exploring new directions such as "dynamic generation".

進一步打好 Coding 的地基，做好 Coding 的 Dogfooding（數據回流、評測，形成飛輪），提升 Agent 能力。

Doubao 強化商業化能力，重點場景為「辦公」。

字節的未竟之地：世界模型如今，在字節的 AI 矩陣中，有讓字節終於得以進入中國大模型第一梯隊的 Seed 2.0，還有達到世界 SOTA 水平的 Seedance 2.0；此外，在應用端，豆包也形成了斷層式領先——我們從多方了解到，2026 年春節過後，豆包 DAU 達到 2 億。

「沒有明顯短板。」一名大廠 AI 戰略如此評價字節的 AI 業務矩陣。

但在眾多模型中，唯獨缺少了大模型研究下一階段的關鍵：世界模型。

幾名接近 Seed 團隊的人士告訴我們，字節是進軍世界模型賽道的較晚參與者。2024 年，剛從阿里加入字節的周暢，扛起了世界模型研究的大旗。

但當時內部的判斷是，世界模型路線和商業化場景還不明确，更重要的是打好視頻模型的仗。

直到 2025 年，字節才在小範圍內成立研究組，開始對世界模型中的 VLA（視覺-語言-動作模型）路線進行探索。帶隊人有兩位：

一是字節 AI Lab 負責人李航——2025 年 4 月，AI Lab 整體（包含 Robotics 團隊）併入了 Seed，目的之一是提升模型和應用（具身智能）之間的溝通效率——主要基於模擬數據進行世界模型訓練。

另一位是 Seed 多模態研究員王文千，主要基於自然數據做訓練。

到 2026 年，吳永輝終於在 Seed 全員會上為世界模型設立了一個明確的目標：在 2026 年底之前至少發布一版世界模型，性能對標目前的世界 SOTA（最佳）—— Google 在 2025 年 8 月發布的 Genie 3。

但從目前的進度來看，追趕的速度不夠。一位接近 Seed 的人士告訴我們，吳永輝多次在 Seed 內部會議中直言字節世界模型和具身智能的效果不及預期。

另有 Seed 成員透露，根據內部評測，截至 2026 年初，字節世界模型的綜合性能距離全球 SOTA 還存在 10% 的差距。

但這場仗代表未來。

一方面，世界模型的下游，是至少千億美元規模的具身智能市場，以及極具想像空間的遊戲和娛樂場景。

一名前 Seed 研究員曾向我們表示，字節機器人此前的落地場景主要為物品運輸、工業搬運，但內部判斷天花板較低，「市場前景更廣闊的人形機器人是字節一定會入局的方向。」

另一方面，世界模型的路線仍存在許多非共識，包括視頻生成派、VLA（視覺-語言-動作模型）派、JEPA（像素預測）派等。

「以字節的人才密度和資金投入，大概率能贏。」一名 AI 投資者對我們分析道，「不賭，則一定會輸。」

為實現躋身世界第一梯隊的目標，自2026年以來，字節已對世界模型訓練進行了多項調整。

《智能湧現》得知，2026年春節後，Seed 新設立了一支世界模型研究組，負責人為前Meta FAIR Lab研究員范浩奇，匯報給 Seed 多模態和世界模型負責人周暢；

Meanwhile, the two VLA research teams led by Li Hang and Wang Wenqian have been merged and now report uniformly to Zhou Chang.

多名知情人士告訴《智能湧現》，原來李航和王文千的研究組所探索的路線，主要是 VLA，追求「即興」、「真實」，目標應用場景是具身智能；而范浩奇帶領的新隊伍走的則是 3D 仿真路線，主打娛樂和遊戲這類應用場景。

除了人力和探索路線的擴張，世界模型在資金投入上也是文本、Coding、影片等多個模型方向中最高的。

顯著的是數據預算。一名字節數據平台的員工告訴我們，此前在 LLM（大語言模型）和 Seedance 2.0 上取得顯著收益的「走量」策略，團隊計劃將同樣的「數海戰術」應用於世界模型的訓練上。

這也對應著更高昂的數據投入——我們從多方了解到，2026 年，字節給世界模型的訓練數據（包括 VLA、長視頻、3D 等模態）的預算，在各個模態中是最高的，金額達到數千萬元。

一名數據供應商提到，字節在世界模型上的數據投入，可達其他廠商的 3-4 倍。

Coding：追求更極致的數據工程 Coding 能力是基礎，是決定 Agent 效果上限的關鍵——這已成為業界的共識。

多位知情人士曾向我們提及字節對 Coding 的重視。「字節對 Coding 的投入一直很高，僅次於今年的世界模型。」一位接近 Seed 的人士告訴《智能湧現》。

例如，內部會定向採購數據，或研究 Claude Code、CodeX 等海外頂尖 Coding 模型的訓練數據 demo。

在 2025 年的火山引擎 Force 大會上，字節跳動技術副總裁洪定坤也表示，Coding 作為一種高度結構化、邏輯嚴密的任務，對模型理解複雜的語義結構、邏輯推理、算法設計和精確表達都有很高的要求，能助力模型智能上限的探索。

但在外界，字節 Coding 業務的存在感一直不強。無論是 2025 年 11 月發布的模型 Doubao-Seed-Code，還是 2025 年初發布的 AI 編程工具 Trae，效果和聲量都不及智譜的 GLM 5 和月之暗面的 K2。

一名知情者評價：「字節 Coding 效果難以取得突破的原因在於缺少數據回流。」由於模型能力有限，字節相關業務都不願意使用 Seed-Code。

就連 AI 編碼應用 Trae，最早接入的也是 DeepSeek 和 Claude Code，以及產品內部自行訓練的 Coding 模型。

這就導致字節 Coding 模型缺少來自真實應用場景的反饋。

自 2026 年以來，不少字節員工感受到，各個業務方正在加大對 Seed 模型的支持力度。一名 Seed 員工告訴《智能湧現》，原來字節並不限制業務側使用第三方 Coding 模型進行開發，但自 2026 年以來，多個應用部門被強制要求使用 Seed 模型。

不過，在更極致的數據投入下，Seed 在人才招聘上的速度倒是稍有放緩。

有 AI 圈獵頭告訴《智能湧現》，字節 HR 現在對外釋放的訊號是：粗放高薪招聘的時代已經結束了，接下來的命題是內部培養、提拔年輕人才，提高算法待遇。

如今，Seed 少有的招聘名額，主要開放給來自 DeepSeek 以及 OpenAI、DeepMind、Meta 等海外大廠的 AI 人才，例如前 DeepSeek 核心成員郭達雅、前英偉達研究員董鑫。

Seedance 如何保持 SOTA 地位？2026 年字節在 AI 模型上的另一個重點，則是維持 Seedance 在全球視頻生成領域的 SOTA 地位。

“Seedance 2.0 的勝利，是數據的勝利。”某視頻生成初創企業的創始人曾對《智能湧現》這樣評價 Seedance 2.0。我們得知，龐大的訓練數據量和超過 2000 人的評測團隊，造就了 Seedance 2.0 的亮眼效果。

但持續靠「走量」的訓練方式也存在隱憂。一些研究表明，視頻生成領域存在「Anti-Scaling Law」現象，簡單而言，訓練數據越多，模型越容易「偷懶」，只學習某些關鍵幀，而忽視完整敘事——因此，越到訓練後期，數據「走量」的收益往往越低。

兩名數據側的知情人士告訴我們，Seedance 在預訓練上已經達到天花板，接下來想要提升性能，就必須清洗訓練數據，進行更精細的後訓練。

Meanwhile, the "dynamic generation" capability is a new focus area for the 2026 Seedance team.

所謂的「動態生成」，也就是互動視頻，指的是用戶可以輸入指令，隨時調整視頻生成的內容和劇情。在這一賽道上，已經誕生了估值高達 13.2 億美元的 Vivix AI（由前商湯高級研究總監劉宇創立）。

多名知情者告訴《智能湧現》，周暢一直十分看好動態生成的落地前景。

「互動影片可以做成小遊戲，也可以做成互動劇集，同時也能與世界模型的探索接軌（影片生成也是世界模型的一條探索路徑）。」一名接近 Seed 的人士表示。

加速豆包的商業化和出海 36氪曾獨家報導，豆包預計將在 6 月下旬正式上線付費內容；與此同時，豆包也在計劃與抖音電商打通，完善付費場景。

在 2026 年 5 月初，豆包曾於 App Store 更新付費訂閱方案，月訂閱價格從免費到 500 元不等。

On June 3, DouBao officially announced that it will soon launch "DouBao Pro" to meet the productivity needs of professionals, offering professional services including software development, data analysis, professional design, process automation, financial analysis, and scientific research.

多名知情者透露，春節後，豆包 DAU 已突破 2 億。「今年豆包的投流預算很低。」在一名知情者看來，高 DAU 帶來的是高昂的推理成本和運維壓力，豆包在這個時間點推進商業化，帶有降低增長速度以及自我造血的雙重目的。

而 PPT 生成，是豆包建立用戶付費心智的核心切入點。「豆包希望加強 PPT 生成功能，是為了面向金融、法律等高淨值行業的白領收費。」一名接近豆包的人士告訴《智能湧現》，下一階段，豆包還計劃推出企業版，與企業內部的系統打通，但內部仍在討論具體的結合方式。

他表示，這一想法受到了海外模型商業模式的啟發。目前，面向辦公場景收費這條商業化路徑，在海外已經得到了驗證。據 Anthropic 披露的數據，Claude Code 上線僅 6 個月，ARR 就達到了 10 億美元；上線一年後，2026 年 2 月的 ARR 已經達到了 25 億美元。

Claude Code 為企業開發場景帶來的可觀現金流，也讓成立比 OpenAI 晚了 6 年的 Anthropic，在今年年初一躍反超 OpenAI 的 ARR。

現在，豆包要解決的問題，就是將用戶的心智從一個可以免費詢問一切的「通用入口」，轉變為一個雖然需要付費但能幫助你提升效率的「辦公助手」。

不過，豆包想進入的這個市場已經開始擁擠。有豆包人士對智能湧現提到，在調研企業客戶的過程中，字節發現企業 AI 工具市場已被不少行業 AI 解決方案供應商佔據，遲來的豆包必然要面對更高的獲客成本。

《智能湧現》了解到，出海也是豆包今年的重要命題之一。

此前，豆包海外版應用 Dola 在 2025 年底的 DAU 已突破千萬。《智能湧現》了解到，Dola 2026 年的增長目標為：年底達到 3000 萬 DAU。

一名知情人士表示，小語種國家是 Dola 面向的主要市場。目前，海外 AI Chatbot 市場，已經基本被 ChatGPT、Claude、Gemini 占據。不在歐美市場與「AI 御三家」正面對抗，差異化切入小語種市場，是 Dola 的增長策略。

第三方數據顯示，自 2025 年下半年以來，Dola 頻繁登上印尼、馬來西亞、墨西哥等國家的應用商店下載榜。

——

加入字節一年來，吳永輝的任務就是帶領 Seed 一邊修復 Bug，一邊開發 SOTA 模型。而 2026 年，在 AI 的每一個戰場上，字節的目標都是成為贏家。

如今，Seed 2.0、Seedance 2.0 已初見成效，Seed 所累積的工程、數據經驗與人才，也將以更高效的方式，重複運用於下一場戰爭中。

（《智能湧現》作者鄧詠儀對本文亦有貢獻。）