Ang AI strategy ng ByteDance para sa 2026 ay nakatuon sa apat na direksyon: world model, video model Seedance, coding, at commercialization ng DouBao.
May-akda ng artikulo: Zhou Xinyu
Pinagkunan: 36氪
Ayon sa eksklusibong impormasyon mula sa maraming pinagkukunan, mayroong apat mahalagang paksang tatagpuan ng ByteDance AI noong 2026:
Dagdagan ang pagsisikap sa pagtrabaho sa pag-train ng mga global model, at sa tapos ng taon, ang performance ng model ay magiging katumbas ng kasalukuyang pinakamahusay na global model sa mundo, ang Google Genie 3.
Ang video model ay patuloy na nasa unahan, at nag-aaral ng mga bagong direksyon tulad ng “dynamic generation.”
Lakasan ang pundasyon ng Coding, gawing mabuting Dogfooding ng Coding (data feedback, pag-evaluate, lumikha ng flywheel), at palakasin ang kakayahan ng Agent.
Pinapalakas ng Doubao ang kanyang kakayahang komersyal, na may pangunahing aplikasyon sa "opisina".
Ang hindi natapos na lupain ng ByteDance: Ang mga mundo ng modelo. Sa kasalukuyan, sa agham na matrix ng ByteDance, mayroon silang Seed 2.0 na nagbigay sa kanila ng pagkakataon na makapasok sa unang grupo ng malalaking modelo sa China, at ang Seedance 2.0 na nakamit ang pinakamataas na antas sa mundo (SOTA). Sa aplikasyon, ang DouBao ay nagsagawa ng malaking pagkakaiba—ayon sa maraming pinagkunan, ang DAU ng DouBao ay umabot sa 200 milyon pagkatapos ng Bagong Taon ng 2026.
"Walang malinaw na kahinaan." Ganito ang pagtataya ng isang malaking kumpanya na AI strategist sa portfolio ng AI ni ByteDance.
Ngunit sa gitna ng lahat ng mga modelo, kulang ang pangunahing bahagi ng susunod na yugto ng pag-aaral ng malalaking modelo: ang mundo ng modelo.
Ibinigay sa amin ng ilang taong malapit sa Seed team na ang ByteDance ay isang huling miyembro sa larangan ng world models. Noong 2024, kinuha ni Zhou Chang, na bagong pumunta sa ByteDance mula sa Alibaba, ang pangunahing papel sa pag-aaral ng world models.
Ngunit noong panahong iyon, ang panloob na pagtataya ay ang landas ng world model at ang mga komersyal na aplikasyon ay hindi pa malinaw, at mas mahalaga ang pagpapalakas ng laban sa video model.
Hanggang 2025, nagtatag lang ang ByteDance ng isang maliit na research team upang magsimula sa pag-aaral ng VLA (Visual-Language-Action) pathway sa world models. Ang mga lider ay dalawa:
Una ay si Li Hang, pangulo ng AI Lab ng ByteDance—noong Abril 2025, ang buong AI Lab (kabilang ang Robotics team) ay isinama sa Seed, isa sa mga layunin ay upang mapabuti ang efisyensiya ng komunikasyon sa pagitan ng modelo at aplikasyon (embodied intelligence)—na pangunahing batay sa pagtatrabaho sa仿真 data.
Ang isa pa ay si Wang Wenqian, siyentipiko sa multimodal ng Seed, na pangunahing nagtatrabaho sa pamamagitan ng natural na data.
Sa 2026, natapos ni Wu Yonghui ang isang malinaw na layunin sa buong Seed meeting para sa world model: maglabas ng kahit isang bersyon ng world model bago ang dulo ng 2026, na may performance na katumbas ng kasalukuyang SOTA sa mundo—ang Genie 3 na inilabas ng Google noong Agosto 2025.
Ngunit batay sa kasalukuyang progreso, hindi sapat ang bilis ng paghahabol. Sabi ng isang taong malapit sa Seed, madalas na sinabi ni Wu Yonghui sa mga pribadong pagpupulong ng Seed na ang mga modelo ng ByteDance at ang embodied intelligence ay hindi nakamit ang inaasahang epekto.
Ibinigay din ng isang miyembro ng Seed na batay sa panloob na pagtataya, hanggang sa unang bahagi ng 2026, ang kabuuang performance ng Byte World Model ay may 10% na kalayuan mula sa global SOTA.
Ngunit ang laban na ito ay nagtataglay ng kinabukasan.
Sa isang panig, ang downstream ng world model ay ang mga market para sa embodied intelligence na may halaga ng hindi bababa sa $100 bilyon, pati na rin ang mga escenario sa gaming at entertainment na may malawak na potensyal.
Isinampa ng isang dating researcher ng Seed na ang mga dating aplikasyon ng ByteRobot ay pangunahin ang paghahatid ng mga bagay at industriyal na paghahatid, ngunit ang loob na pagtataya ay may mababang takip, “ang humanoid robot na may mas malawak na pananaw sa merkado ay ang direksyon na sasaliin ng Byte.”
Sa kabilang panig, mayroon pa ring maraming hindi pagkakasundo sa landas ng world models, kabilang ang mga pangkat ng video generation, VLA (visual-language-action models), at JEPA (pixel prediction).
“Sa pagtaya, batay sa density ng talent at pagsisikap sa pondo, malaki ang posibilidad na mananalo.” Sabi ng isang investor sa AI sa amin, “Kung hindi mo ito tataya, siguradong mawawala ka.”
Sa pagkamit ng layunin na makapasok sa unang tier ng mundo, simula noong 2026, ginawa na ng ByteDance ang ilang pagbabago sa pag-train ng world models.
Ayon sa《Intelligent Emergence》, matapos ang Chinese New Year ng 2026, itinatag ni Seed ang isang bagong grupo para sa pag-aaral ng world model, na pinamumunuan ni Fan Haoqi, dating researcher ng Meta FAIR Lab, at nagrereport sa Zhou Chang, ang tagapamahala ng multimodal at world model ni Seed;
Samantala, pinagsama ang dalawang grupo ng pag-aaral na pinamumunuan ni Li Hang at Wang Wenqian, at nag-uulat na lamang sila sa Zhou Chang.
Sinabi ng maraming may-alam sa Smart Emergence na ang grupo ni Li Hang at Wang Wenqian ay nagsisikap sa VLA, na naglalayong “improvisational” at “totoo,” na may layuning aplikasyon ang embodied intelligence; samantalang ang bagong koponan ni Fan Haoqi ay nagsusulong ng 3D simulation route, na nakatuon sa mga aplikasyon tulad ng entertainment at gaming.
Kung ihahambing sa pondo, ang world model ay ang pinakamataas sa lahat ng direksyon ng model tulad ng teksto, coding, at video, kasama ang pagpapalawak ng puwersa ng paggawa at mga ruta ng paglalakbay.
Napakalaking bahagi ang budget para sa data. Sinabi ng isang empleyado ng ByteDance platform na ang estratehiya ng “pagpapalaki ng dami” ng training data, na nakamtan ang malaking benepisyo sa LLM at Seedance 2.0, ay plano ng team na gamitin ang parehong “taktika ng dagat ng data” sa pagtatrabaho ng world model.
Ito ay tumutugon sa mas mataas na gastos sa data—mula sa iba’t ibang pinagkukunan, nalaman namin na noong 2026, ang budget na ibinigay ng ByteDance para sa pag-train ng world model (kabilang ang VLA, mahabang video, 3D, at iba pang modalities) ay ang pinakamataas sa lahat ng modalities, na umabot sa maraming milyon yuan.
Isinampa ng isang tagapagbigay ng data na ang pagkakaloob ng data ni ByteDance sa mga mundo model ay maaaring umabot sa 3-4 beses ang dami ng iba pang mga kumpanya.
Coding: Ang paghahanap ng mas mahusay na kakayahan sa data engineering ay ang pundasyon, at ito ang nagtatakda ng hangganan ng epekto ng Agent—ito ay naging pagsang-ayon ng industriya.
Maraming mga may-alam ang nagbanggit sa amin tungkol sa pagpapahalaga ni ByteDance sa Coding. “Patuloy na mataas ang pagkakaloob ni ByteDance sa Coding, ikalawa lamang sa world model ng taong ito,” ayon sa isang taong malapit sa Seed.
Halimbawa, ang loob ay magpapautang ng data nang direkta, o mag-aaral ng mga demo ng training data ng mga overseas na pinakamataas na Coding model tulad ng Claude Code at CodeX.
Sa Force Conference ng Volcano Engine noong 2025, sinabi rin ni Hong Dingkun, Vice President ng Technology ng ByteDance, na ang Coding, bilang isang mataas na istruktura at lohikal na gawain, ay nangangailangan ng mataas na pag-unawa sa mga kumplikadong semantikong istraktura, lohikal na pag-iisip, disenyo ng algoritmo, at eksaktong pagpapahayag, at makakatulong sa pag-aaral ng hangganan ng智能化 ng modelo.
Ngunit sa labas, ang pagkakakilanlan ng ByteDance Coding business ay patuloy na mahina. Anuman ang Doubao-Seed-Code na ipinakilala noong Nobyembre 2025 o ang AI programming tool na Trae na ipinakilala noong simula ng 2025, ang epekto at ingay nito ay hindi kasalungat sa GLM 5 ng Zhipu at K2 ng Moonshot.
Ang isang may-alam ay nag-evaluate: “Ang dahilan kung bakit mahirap makamit ang pagbubukas sa epekto ng Coding ng ByteDance ay ang kakulangan ng data feedback.” Dahil sa limitadong kakayahan ng modelo, ayaw ng mga kaukulang negosyo ng ByteDance na gamitin ang Seed-Code.
Kahit ang AI Coding app na Trae, ang unang mga inilalakbay ay ang DeepSeek at Claude Code, pati na rin ang sariling tinuturong Coding model sa loob ng produkto.
Nagresulta ito sa kakulangan ng feedback mula sa mga totoong aplikasyon ng mga modelo ng Byte Coding.
Simula noong 2026, maraming empleyado ng ByteDance ang naramdaman ang pagpapalakas ng suporta ng iba’t ibang business unit sa Seed model. Sabi ng isang empleyado ng Seed sa Intelligent Emergence, dating hindi pinipigilan ng ByteDance ang mga business side na gamitin ang third-party Coding model para sa pag-unlad, ngunit simula noong 2026, pinipilit na gamitin ng maraming application department ang Seed model.
Gayunpaman, sa mas malalim na pagpapahalaga sa datos, ang pagtakbo ng Seed sa paghahanap ng tauhan ay medyo nabawasan.
Sinabi ng isang headhunter mula sa AI community sa Intelligent Emergence: Ang mensahe na inilalabas ng HR ng ByteDance ay ang panahon ng masalimuot at mataas na sahod sa paghingi ng empleyado ay tapos na; ang susunod na hamon ay ang pagpapalago at pagpapataas ng mga batang talento sa loob, at pagpapabuti ng kompensasyon para sa mga algoritmo.
Sa kasalukuyan, ang mga posisyon sa paghahanap ng talento ng Seed ay limitado, at pangunahing inaasahang mula sa mga AI na propesyonal mula sa mga malalaking kumpanya sa labas ng bansa tulad ng DeepSeek, OpenAI, DeepMind, at Meta, tulad ni Guo Daya, dating core member ng DeepSeek, at Dong Xin, dating researcher ng NVIDIA.
Paano ngang panatilihin ni Seedance ang posisyon nitong SOTA? Sa 2026, ang isa pang pangunahing layunin ng ByteDance sa mga AI model ay ang pagpapanatili ng SOTA status ni Seedance sa global na larangan ng video generation.
Ang tagumpay ng Seedance 2.0 ay ang tagumpay ng data,” ayon sa isang tagapagtatag ng isang startup sa paggawa ng video sa《Intelligent Emergence》. Alam namin na ang malaking dami ng training data at ang higit sa 2,000 na miyembro ng team ng pag-evaluate ang nagbigay sa Seedance 2.0 ng kanyang nakakagulat na epekto.
Ngunit may mga pag-aalala din sa patuloy na paggamit ng paraan ng “volume-based” training. Ilan sa mga pag-aaral ay nagpapakita ng phenomenon na “Anti-Scaling Law” sa larangan ng video generation; sa simpleng salita, ang mas maraming training data, mas malaki ang posibilidad na ang modelo ay “magiging malazy” at mag-aaral lamang ng ilang key frames, habang iniisip ang buong istorya—kaya, sa huling bahagi ng training, ang benepisyo ng pagpaparami ng data ay karaniwang bumababa.
Sinabi sa amin ng dalawang nakakaalam sa side ng data na ang Seedance ay nasa maximum na sa pre-training, at upang mapabuti ang performance, kailangan nilang linisin ang training data at gawin ang mas detalyadong post-training.
Samantala, ang “dynamically generated” capability ay ang bagong direksyon na pinapansin ng team ng Seedance noong 2026.
Ang tinatawag na "dynamic generation," o interactive video, ay nangangahulugan na ang mga user ay maaaring mag-input ng mga utos upang baguhin ang nilalaman at kuwento ng video sa anumang oras. Sa larangan na ito, umusbong na ang Vivix AI na may halagang $1.32 bilyon (itinatag ni Liu Yu, dating senior research director ng SenseTime).
Ibinigay ng maraming nakakaalam sa Smart Emergence na si Zhou Chang ay laging may malaking pag-asa sa pagkakaroon ng dinamikong pagbuo.
Ang interaktibong video ay maaaring gawing maliliit na laro, interaktibong serye, at maaari rin itong makipag-ugnayan sa pag-aaral ng mundo model (ang pagbuo ng video ay isang landas sa pag-aaral ng mundo model).” Sabi ng isang taong malapit sa Seed.
Papabilis ang komersyalisasyon at paglalabas ng DouBao. Noong isang eksklusibong ulat ng 36Kr, inaasahan na magsisimula ang DouBao sa pagpapalabas ng bayad na nilalaman noong huling bahagi ng Hunyo; samantala, plano rin ng DouBao na i-integrate ang sarili nito sa e-commerce ng TikTok upang mapagbuti ang mga escenario ng bayad.
Noong unang bahagi ng Mayo 2026, nag-update ang DouBao ng mga opsyon ng bayad na subscription sa App Store, kung saan ang presyo ng monthly subscription ay nasa pagitan ng libre hanggang 500 yuan.
Noong Hunyo 3, inanunsyo rin ng official na豆包 ang paglalabas ng “Doubao Professional Edition” na lalayunin sagutin ang productivity needs ng mga propesyonal, kasama ang mga serbisyo tulad ng software development, data analysis, professional design, process automation, financial analysis, at scientific research.
Ibinigay ng maraming may-alam na noong pagkatapos ng Chinese New Year, ang DAU ng DouBao ay lumampas sa 200 milyon. “Ang budget para sa pagpapalaganap ng DouBao sa taong ito ay mababa.” Ayon sa isang may-alam, ang mataas na DAU ay nagdudulot ng malaking gastos sa pagpapatakbo at presyur sa operasyon, at ang pagpapalaganap ng komersyalisasyon ng DouBao sa panahong ito ay may dalawang layunin: pagbawas sa bilis ng paglago at pagkamit ng sariling pagkakakitaan.
Ang pagbuo ng PPT ay ang pangunahing punto ng pagpapakilala sa pagkakaroon ng isang pagbabayad na mentalidad ng DouBao. “Gusto ng DouBao na palakasin ang kakayahan sa pagbuo ng PPT upang makapagcharge sa mga propesyonal sa mga mataas na halaga na industriya tulad ng pagsasalapi at batas,” sabi ng isang taong malapit sa DouBao sa Smart Emergence. Sa susunod na yugto, plano rin ng DouBao na ilunsad ang enterprise version at i-integrate ito sa mga loob na sistema ng mga kumpanya, ngunit patuloy pa rin ang pag-uusap tungkol sa mga partikular na paraan ng pagsasama.
Sinabi niya na ang ideyang ito ay naging inspirasyon mula sa mga modelo ng negosyo sa ibang bansa. Sa kasalukuyan, ang komersyal na landas na pagkakaroon ng bayad para sa mga办公场景 ay napatunayan na sa ibang bansa. Ayon sa mga datos na inilahad ni Anthropic, nakamit ng Claude Code ang ARR na $1 bilyon sa loob ng anim na buwan lamang mula sa paglalunsad; isang taon pagkatapos, ang ARR noong Pebrero 2026 ay umabot na sa $2.5 bilyon.
Ang malaking cash flow na dinala ng Claude Code para sa mga enterprise development scenario ay nagbigay-daan sa Anthropic, na itinatag 6 taon pagkatapos ng OpenAI, na umabot sa mas mataas na ARR kaysa sa OpenAI noong unang bahagi ng taon.
Ngayon, ang problema na dapat lutasin ng DouBao ay ang pagbabago ng pagkakaunawa ng mga user mula sa isang “pangkalahatang entry point” kung saan maaaring magtanong nang libre tungkol sa anumang bagay, patungo sa isang “opisyal na asistente” na kahit may bayad, ay makakatulong sa pagpapataas ng kanilang efficiency.
Gayon, ang merkado na nais pumasok ni DouBao ay nagsisimula nang maging puno. Sinabi ng isang tagapag-ugnay ni DouBao sa Intelligent Emergence na habang pinag-aaralan ang mga kliyente sa negosyo, natuklasan ng ByteDance na ang merkado ng mga AI tool para sa negosyo ay naitatag na ng maraming tagapagbigay ng AI solusyon sa industriya, at ang pagdating ni DouBao ay magdudulot ng mas mataas na gastos sa pagkuha ng mga kliyente.
Natutunan ng Smart Emergence na ang paglalabas sa international market ay isa rin sa mahalagang layunin ng DouBao sa taong ito.
Bago, ang海外版 app ng DouBao, ang Dola, ay nakakapagpasikat na sa isang milyon na DAU sa hangganan ng 2025. Ayon sa Intelligent Emergence, ang target sa paglago ng Dola para sa 2026 ay: makamit ang 30 milyon na DAU sa katapusan ng taon.
Sinabi ng isang may-alam na ang mga bansang may maliit na wika ay ang pangunahing merkado na tinutukoy ng Dola. Sa kasalukuyan, ang海外 AI Chatbot market ay halos napapalibutan na ng ChatGPT, Claude, at Gemini. Ang pag-iwas sa direktang pagtutol sa mga merkado ng Europa at Amerika laban sa “mga tatlong pangunahing AI” at ang pagpili ng iba’t ibang pagkakataon sa mga merkado ng maliit na wika ay ang estratehiya ng paglago ng Dola.
Ayon sa mga datos mula sa mga third party, simula noong ikalawang kalahati ng 2025, madalas na nakakapila ang Dola sa mga listahan ng pag-download sa app stores ng Indonesia, Malaysia, Mexico, at iba pang mga bansa.
——
Noong isang taon niyang sumali sa ByteDance, ang misyon ni Wu Yonghui ay ang gabayan ang Seed sa pag-ayos ng mga bug habang nagbuo ng SOTA models. At noong 2026, sa bawat battlefield ng AI, ang layunin ng ByteDance ay maging tagapagtagumpay.
Ngayon, ang Seed 2.0 at Seedance 2.0 ay nagpapakita na ng mga unang resulta, at ang mga karanasan sa inhinyeriya, data, at talento na nakumpuni ng Seed ay magiging muling gamitin sa mas epektibong paraan sa susunod na digmaan.
(May kontribusyon si Deng Yongyi, may-akda ng “Intelligent Emergence”, sa artikulong ito.)
