Strategi AI ByteDance tahun 2026 berfokus pada empat arah: world model, video model Seedance, Coding, dan komersialisasi Doubao.
Penulis artikel: Zhou Xinyu
Sumber artikel: 36氪
《Kemunculan Cerdas》 secara eksklusif memperoleh informasi dari beberapa sumber bahwa pada tahun 2026, AI ByteDance memiliki empat topik penting:
Tingkatkan investasi dalam pelatihan model global, hingga akhir tahun, kinerja model mencapai level SOTA global terkini dari Google Genie 3.
Model video tetap memimpin, mengeksplorasi arah baru seperti "generasi dinamis".
Perkuat fondasi Coding, lakukan Dogfooding Coding (aliran data, evaluasi, membentuk siklus umpan balik), dan tingkatkan kemampuan Agent.
Doubao memperkuat kemampuan komersialisasi, dengan fokus pada skenario "kantor".
Wilayah yang belum diraih oleh ByteDance: Model Dunia Saat ini, dalam matriks AI ByteDance, ada Seed 2.0 yang membuat ByteDance akhirnya masuk ke jajaran teratas model besar Tiongkok, serta Seedance 2.0 yang mencapai level SOTA dunia. Di sisi aplikasi, DouBao juga memperoleh keunggulan yang sangat signifikan—kami memperoleh informasi dari berbagai pihak bahwa setelah Tahun Baru Imlek 2026, DAU DouBao mencapai 200 juta.
"Tidak ada kelemahan yang jelas." Seorang strategi AI dari perusahaan besar menilai matriks bisnis AI ByteDance.
Namun, di antara berbagai model, yang hilang adalah kunci tahap berikutnya dalam penelitian model besar: model dunia.
Beberapa orang yang dekat dengan tim Seed memberi tahu kami bahwa ByteDance adalah pemain yang masuk ke jalur model dunia cukup terlambat. Pada tahun 2024, Zhou Chang, yang baru bergabung dari Alibaba ke ByteDance, memikul tanggung jawab dalam penelitian model dunia.
Namun, pada saat itu, penilaian internal adalah bahwa arah model dunia dan skenario komersialisasi masih belum jelas, yang lebih penting adalah memenangkan pertempuran model video.
Hingga 2025, ByteDance baru membentuk tim penelitian dalam skala kecil untuk mengeksplorasi jalur VLA (Visual-Language-Action Model) dalam world models. Tim ini dipimpin oleh dua orang:
Pertama, Li Hang, kepala AI Lab ByteDance—pada April 2025, seluruh AI Lab (termasuk tim Robotics) digabungkan ke dalam Seed, salah satu tujuannya adalah meningkatkan efisiensi komunikasi antara model dan aplikasi (embodied intelligence)—terutama berdasarkan pelatihan model dunia menggunakan data simulasi.
Yang lain adalah peneliti multimodal Seed, Wang Wenqian, yang terutama melakukan pelatihan berdasarkan data alami.
Pada tahun 2026, Wu Yonghui akhirnya menetapkan tujuan jelas untuk model dunia di pertemuan seluruh staf Seed: setidaknya merilis satu versi model dunia sebelum akhir 2026, dengan kinerja yang sebanding dengan SOTA dunia saat ini—Genie 3 yang dirilis Google pada Agustus 2025.
Namun, dari perkembangan saat ini, kecepatan mengejar masih belum cukup. Seseorang yang dekat dengan Seed memberi tahu kami bahwa Wu Yonghui berkali-kali secara terbuka menyatakan dalam rapat internal Seed bahwa model dunia ByteDance dan kecerdasan tubuh tidak memenuhi harapan.
Seorang anggota Seed juga mengungkapkan, berdasarkan evaluasi internal, hingga awal 2026, kinerja komprehensif model dunia Byte masih tertinggal 10% dari SOTA global.
Tetapi pertarungan ini mewakili masa depan.
Di satu sisi, pasar kecerdasan tubuh dengan nilai setidaknya seribu miliar dolar AS, serta skenario game dan hiburan dengan ruang imajinasi yang sangat luas, berada di hilir model dunia.
Seorang mantan peneliti Seed pernah menyampaikan kepada kami bahwa skenario penerapan sebelumnya dari robot Byte terutama mencakup pengangkutan barang dan material industri, tetapi penilaian internal menyatakan bahwa batasannya relatif rendah, “robot humanoid dengan prospek pasar yang lebih luas adalah arah yang pasti akan diambil oleh Byte.”
Di sisi lain, jalur model dunia masih memiliki banyak ketidaksepakatan, termasuk kelompok generasi video, kelompok VLA (Visual-Language-Action Model), kelompok JEPA (pixel prediction), dll.
“Bertaruh, dengan kepadatan bakat dan investasi dana dalam bidang AI, kemungkinan besar akan menang,” kata seorang investor AI kepada kami. “Tidak bertaruh, maka pasti kalah.”
Sejak 2026, demi mencapai tujuan masuk ke kelompok teratas dunia, ByteDance telah melakukan sejumlah penyesuaian dalam pelatihan model dunia.
Menurut《Intelligent Emergence》, setelah Tahun Baru Imlek 2026, Seed membentuk kelompok penelitian model dunia baru, yang dipimpin oleh Fan Haoqi, mantan peneliti di Meta FAIR Lab, dan melapor kepada Zhou Chang, kepala multimodal dan model dunia di Seed;
Sementara itu, dua tim penelitian VLA yang dipimpin oleh Li Hang dan Wang Wenqian digabungkan dan melapor secara terpadu kepada Zhou Chang.
Beberapa sumber yang mengetahui hal ini mengatakan kepada Smart Emergence bahwa kelompok penelitian Li Hang dan Wang Wenqian sebelumnya mengejar pendekatan VLA, yang menekankan "improvisasi" dan "keaslian", dengan aplikasi utama pada embodied intelligence; sementara tim baru yang dipimpin by Fan Haoqi berfokus pada jalur simulasi 3D, dengan penekanan pada aplikasi hiburan dan game.
Selain perluasan tenaga kerja dan rute eksplorasi, model dunia juga merupakan yang paling tinggi dalam hal investasi dana dibandingkan dengan berbagai arah model lainnya seperti teks, coding, dan video.
Yang sangat signifikan adalah anggaran data. Seorang karyawan dari platform data byte memberi tahu kami bahwa strategi “volume data” yang sebelumnya berhasil memperoleh keuntungan signifikan pada LLM dan Seedance 2.0, kini direncanakan akan diterapkan pada pelatihan world model.
Ini juga berarti investasi data yang lebih tinggi—kami menerima informasi dari berbagai pihak bahwa pada tahun 2026, anggaran yang dialokasikan oleh ByteDance untuk data pelatihan model dunia (termasuk modality VLA, video panjang, 3D, dll.) adalah yang tertinggi di antara semua modality, mencapai puluhan juta yuan.
Seorang pemasok data menyebutkan bahwa ByteDance menginvestasikan data 3-4 kali lebih banyak pada model dunia dibandingkan produsen lainnya.
Coding: Mengejar kemampuan engineering data yang lebih ekstrem adalah dasar, yang menentukan batas atas efektivitas Agent—ini telah menjadi konsensus industri.
Beberapa sumber yang mengetahui hal ini pernah menyebutkan kepada kami tentang pentingnya ByteDance terhadap Coding. "ByteDance selalu sangat berkomitmen terhadap Coding, hanya kalah dari model dunia tahun ini," kata seseorang yang dekat dengan Seed kepada Intelligent Emergence.
Misalnya, secara internal akan melakukan pembelian terarah terhadap data, atau meneliti demo data pelatihan model coding terkemuka luar negeri seperti Claude Code dan CodeX.
Di konferensi Force 2025 oleh Volcano Engine, Wakil Presiden Teknologi ByteDance, Hong Dingkun, juga menyatakan bahwa Coding, sebagai tugas yang sangat terstruktur dan logis, menuntut tingkat tinggi dalam pemahaman model terhadap struktur semantik yang kompleks, penalaran logis, desain algoritma, dan ekspresi yang tepat, serta dapat membantu eksplorasi batas kecerdasan model.
Namun di luar, keberadaan bisnis Coding ByteDance selalu kurang terlihat. Baik model Doubao-Seed-Code yang dirilis pada November 2025 maupun alat pemrograman AI Trae yang dirilis awal 2025, efek dan popularitasnya tidak sebesar GLM 5 dari Zhipu dan K2 dari Moonshot.
Seorang sumber yang mengetahui hal ini menilai, "Alasan utama mengapa efek coding ByteDance sulit mencapai terobosan adalah karena kurangnya umpan balik data." Karena kemampuan model terbatas, bisnis terkait ByteDance tidak ingin menggunakan Seed-Code.
Bahkan untuk aplikasi AI Coding Trae, yang pertama kali diintegrasikan adalah DeepSeek dan Claude Code, serta model Coding yang dikembangkan sendiri oleh produk tersebut.
Hal ini menyebabkan model Coding Byte kekurangan umpan balik dari aplikasi nyata.
Sejak 2026, banyak karyawan ByteDance merasakan bahwa berbagai tim bisnis semakin meningkatkan dukungan terhadap model Seed. Seorang karyawan Seed memberi tahu "Intelligent Emergence" bahwa sebelumnya ByteDance tidak membatasi tim bisnis untuk menggunakan model Coding pihak ketiga dalam pengembangan, tetapi sejak 2026, beberapa departemen aplikasi secara paksa diharuskan menggunakan model Seed.
Namun, dengan investasi data yang lebih ekstrem, kecepatan Seed dalam rekrutmen talenta agak melambat.
Seorang headhunter di dunia AI memberi tahu "Intelligent Emergence" bahwa sinyal yang dikeluarkan oleh HR ByteDance sekarang adalah: era rekrutmen gaji tinggi yang tidak terfokus telah berakhir, dan tantangan berikutnya adalah mengembangkan dan mempromosikan bakat muda secara internal, serta meningkatkan kompensasi untuk algoritma.
Saat ini, sedikitnya lowongan pekerjaan yang dibuka oleh Seed terutama ditujukan bagi tenaga AI dari perusahaan besar luar negeri seperti DeepSeek, OpenAI, DeepMind, dan Meta, misalnya Guo Daya, mantan anggota inti DeepSeek, dan Dong Xin, mantan peneliti NVIDIA.
Bagaimana Seedance mempertahankan posisi SOTA-nya Pada tahun 2026, fokus lain ByteDance pada model AI adalah mempertahankan posisi SOTA Seedance di bidang generasi video global.
“Kemenangan Seedance 2.0 adalah kemenangan data.” Seorang pendiri perusahaan rintisan generasi video pernah menilai Seedance 2.0 kepada Intelligent Emergence. Kami mengetahui bahwa volume data pelatihan yang besar dan tim evaluasi lebih dari 2.000 orang menciptakan efek luar biasa dari Seedance 2.0.
Namun, pendekatan pelatihan yang terus-menerus mengandalkan volume data juga menimbulkan kekhawatiran. Beberapa penelitian menunjukkan adanya fenomena "Hukum Anti-Scaling" di bidang generasi video; secara sederhana, semakin banyak data pelatihan, semakin besar kemungkinan model menjadi "malas", hanya mempelajari beberapa frame kunci dan mengabaikan narasi lengkap—sehingga, semakin lanjut tahap pelatihan, manfaat dari peningkatan volume data cenderung semakin berkurang.
Dua sumber yang mengetahui sisi data memberi tahu kami bahwa Seedance telah mencapai batas maksimal dalam pre-training; untuk meningkatkan kinerja selanjutnya, mereka harus membersihkan data pelatihan dan melakukan fine-tuning yang lebih halus.
Sementara itu, kemampuan "dynamic generation" adalah arah baru yang menjadi fokus tim Seedance pada tahun 2026.
Yang disebut "generasi dinamis," atau video interaktif, merujuk pada kemampuan pengguna untuk memasukkan perintah dan menyesuaikan konten serta alur cerita video secara real-time. Di segmen ini, telah muncul Vivix AI yang bernilai hingga 1,32 miliar dolar AS (didirikan oleh Liu Yu, mantan Direktur Riset Senior di SenseTime).
Beberapa sumber yang mengetahui situasi mengatakan kepada Smart Emergence bahwa Zhou Chang selalu sangat percaya pada prospek penerapan generasi dinamis.
“Video interaktif dapat dibuat menjadi game kecil, serial interaktif, serta dapat terhubung dengan eksplorasi model dunia (generasi video juga merupakan salah satu jalur eksplorasi model dunia),” kata seseorang yang dekat dengan Seed.
Mempercepat komersialisasi dan ekspansi internasional DouBao. 36Kr sebelumnya melaporkan eksklusif bahwa DouBao dijadwalkan secara resmi meluncurkan konten berbayar pada akhir Juni; sambil itu, DouBao juga berencana untuk mengintegrasikan dengan e-commerce Douyin guna menyempurnakan skenario pembayaran.
Pada awal Mei 2026, DouBao pernah memperbarui paket langganan berbayar di App Store, dengan harga langganan bulanan berkisar dari gratis hingga 500 yuan.
Pada 3 Juni, DouBao resmi mengumumkan bahwa mereka akan meluncurkan "DouBao Pro" yang dirancang untuk memenuhi kebutuhan produktivitas para profesional, mencakup layanan profesional seperti pengembangan perangkat lunak, analisis data, desain profesional, otomatisasi proses, analisis keuangan, dan penelitian ilmiah.
Beberapa sumber yang mengetahui hal ini mengungkapkan bahwa setelah Tahun Baru Imlek, DAU DouBao telah melewati 200 juta. "Anggaran iklan DouBao tahun ini sangat rendah," menurut salah satu sumber yang mengetahui hal ini. DAU yang tinggi membawa biaya inferensi dan tekanan operasional yang tinggi; pada titik ini, DouBao mendorong komersialisasi dengan dua tujuan: menurunkan laju pertumbuhan dan menciptakan kemampuan mandiri.
PPT generasi adalah titik masuk utama dalam membangun kesadaran pembayaran pengguna oleh Doubao. "Doubao ingin memperkuat fitur generasi PPT untuk memungkinkan pemungutan biaya dari para profesional di industri bernilai tinggi seperti keuangan dan hukum," kata seseorang yang dekat dengan Doubao kepada Smart Emergence. Pada tahap berikutnya, Doubao juga berencana meluncurkan versi perusahaan yang terintegrasi dengan sistem internal perusahaan, tetapi cara integrasi spesifiknya masih dalam diskusi internal.
Dia menyatakan bahwa ide ini terinspirasi oleh model bisnis luar negeri. Saat ini, jalur komersialisasi yang mengenakan biaya untuk skenario perkantoran telah terbukti di luar negeri. Menurut data yang diungkapkan Anthropic, dalam waktu hanya enam bulan sejak peluncuran Claude Code, ARR mencapai 1 miliar dolar AS; setelah satu tahun, ARR pada Februari 2026 telah mencapai 2,5 miliar dolar AS.
Arus kas signifikan yang dihasilkan oleh Claude Code untuk skenario pengembangan perusahaan memungkinkan Anthropic, yang didirikan enam tahun setelah OpenAI, untuk melampaui ARR OpenAI pada awal tahun ini.
Sekarang, masalah yang harus diatasi oleh DouBao adalah mengubah persepsi pengguna dari “pintu masuk umum” yang bisa ditanyai segala hal secara gratis menjadi “asisten kantor” yang meskipun berbayar, dapat membantu meningkatkan efisiensi Anda.
Namun, pasar yang ingin dimasuki Doubao sudah mulai penuh. Seseorang dari Doubao menyebutkan kepada Intelligent Emergence bahwa selama riset pelanggan perusahaan, ByteDance menemukan bahwa pasar alat AI perusahaan telah dikuasai oleh sejumlah penyedia solusi AI industri, sehingga Doubao yang terlambat masuk pasti akan menghadapi biaya akuisisi pelanggan yang lebih tinggi.
《Intelligent Emergence》 mengetahui bahwa ekspansi ke luar negeri juga merupakan salah satu fokus penting DouBao tahun ini.
Sebelumnya, aplikasi versi luar negeri DouBao, Dola, telah mencapai DAU lebih dari 10 juta pada akhir 2025. Menurut Informasi Munculnya Kecerdasan, target pertumbuhan Dola untuk tahun 2026 adalah mencapai 30 juta DAU pada akhir tahun.
Seorang sumber yang mengetahui hal ini mengatakan bahwa negara-negara dengan bahasa minoritas merupakan pasar utama yang dituju oleh Dola. Saat ini, pasar AI Chatbot luar negeri hampir seluruhnya dikuasai oleh ChatGPT, Claude, dan Gemini. Dengan tidak bersaing langsung di pasar Eropa dan Amerika melawan "tiga raksasa AI", Dola menerapkan strategi pertumbuhan dengan memasuki pasar bahasa minoritas secara diferensiasi.
Data pihak ketiga menunjukkan bahwa sejak paruh kedua 2025, Dola sering muncul di daftar unduhan toko aplikasi di Indonesia, Malaysia, Meksiko, dan negara-negara lainnya.
——
Selama satu tahun bergabung dengan ByteDance, misi Wu Yonghui adalah memimpin Seed memperbaiki bug sambil mengembangkan model SOTA. Pada tahun 2026, di setiap medan pertempuran AI, tujuan ByteDance adalah menjadi pemenang.
Saat ini, Seed 2.0 dan Seedance 2.0 telah menunjukkan hasil awal, dan pengalaman teknik, data, serta sumber daya manusia yang dikumpulkan oleh Seed juga akan digunakan kembali dengan cara yang lebih efisien dalam perang baru.
(Deng Yongyi, penulis "Intelligent Emergence," juga memberikan kontribusi terhadap artikel ini.)
