Стратегія ByteDance з штучним інтелектом на 2026 рік зосереджена на моделях світу, Seedance, програмуванні та комерціалізації DouBao

Стратегія ByteDance з штучним інтелектом на 2026 рік зосереджена на чотирьох напрямках: світова модель, відеомодель Seedance, кодування та комерціалізація DouBao.

Автор статті: Чжоу Сіньюй

Джерело: 36氪

Згідно з ексклюзивною інформацією з кількох джерел, у 2026 році у Byte AI буде чотири важливі завдання:

Збільшити інвестиції у навчання світових моделей; до кінця року досягти рівня продуктивності моделі, що відповідає сучасному глобальному SOTA (найкращому) Google Genie 3.

Відеомоделі продовжують залишатися на лідируючих позиціях, досліджуючи нові напрямки, такі як «динамічне генерування».

Ще краще закласти основи кодування, забезпечити Dogfooding у кодуванні (зворотний зв’язок даних, оцінка, створення петлі), щоб підвищити здатності агента.

DouBao підсилює свою комерційну здатність, зосереджуючись на сценаріях «офіс».

Незавершені землі ByteDance: Моделі світу. Зараз у AI-матриці ByteDance є Seed 2.0, який дозволив ByteDance увійти до першої групи китайських великих моделей, а також Seedance 2.0, який досяг світового рівня SOTA. Крім того, у сфері застосунків DouBao має стрімкий лідерство — з кількох джерел ми дізналися, що після Нового року 2026 року DAU DouBao досяг 200 мільйонів.

«Немає очевидних слабких місць.» Так оцінив один із стратегів штучного інтелекту великої компанії портфель AI ByteDance.

Але серед усіх моделей відсутня ключова наступна фаза досліджень великих моделей: світова модель.

Кілька осіб, близьких до команди Seed, повідомили нам, що ByteDance приєдналася до гонки у сфері світових моделей досить пізно. У 2024 році Чжоу Чан, який тільки що приєднався до ByteDance з Alibaba, взяв на себе лідерство у дослідженнях світових моделей.

Тоді внутрішній висновок був таким: напрямок світових моделей та комерційні сценарії ще не були чіткими, важливішим було добре вести битву за відеомоделі.

До 2025 року ByteDance створила невелику дослідницьку групу для дослідження напрямку VLA (візуально-мовна-дієва модель) у світових моделях. Керівниками були двоє:

Перше — керівник AI Lab компанії ByteDance Лі Хан: у квітні 2025 року весь AI Lab (разом із командою Robotics) було об’єднано з Seed, одна з цілей — підвищити ефективність взаємодії між моделями та застосунками (ембодід-інтелект) — навчання моделей світу здійснюється переважно на симуляційних даних.

Іншим є Ван Веньцянь, дослідник з мультимодальності Seed, який здійснює навчання переважно на природних даних.

У 2026 році Ву Юнхуей на загальній зустрічі Seed встановив чітку мету для світової моделі: до кінця 2026 року випустити принаймні одну версію світової моделі, продуктивність якої буде зіставна з поточною світовою SOTA — Genie 3, випущеною Google у серпні 2025 року.

Але з урахуванням поточного прогресу, швидкість відновлення недостатня. Один із осіб, близьких до Seed, розповів нам, що Ву Юнхуей неодноразово відкрито казав у внутрішніх зустрічах Seed, що ефективність моделей світу ByteDance та ембодімент-інтелекту не відповідають очікуванням.

Інший член Seed зазначив, що згідно з внутрішніми оцінками, на початок 2026 року загальна продуктивність моделі Byte World відрізняється від глобального SOTA на 10%.

Але ця битва символізує майбутнє.

З одного боку, нижнім етапом світової моделі є ринок ембоді-інтелекту обсягом щонайменше 100 мільярдів доларів США, а також надзвичайно перспективні сценарії ігор та розваг.

Колишній дослідник Seed раніше сказав нам, що раніше сценарії впровадження ботів Byte були зосереджені на транспортуванні товарів та промисловому переміщенні, але внутрішні оцінки вказували на низький потенціал росту: «Роботи-андроїди з більш широким ринковим потенціалом — це напрямок, який Byte обов’язково займе».

З іншого боку, шляхи світових моделей все ще залишаються неузгодженими, включаючи напрямки генерації відео, VLA (візуально-мовна-дієва модель), JEPA (піксельна прогнозування) тощо.

«Зробивши ставку на щільність талантів та інвестиції в байти, велика ймовірність перемоги», — проаналізував для нас інвестор у сфері ШІ. «Не роблячи ставки, ви обов’язково програєте».

З метою входити до першої світової групи, з 2026 року ByteDance внесла багато змін у навчання світових моделей.

За інформацією з «Інтелектуального виникнення», після Нового року 2026 року Seed створив нову дослідницьку групу зі світових моделей, керівником якої є колишній дослідник Meta FAIR Lab Фан Хаоці, який звітує перед Чжоу Чаном, керівником багатомодальних та світових моделей Seed;

Тим часом два дослідницьких групи під керівництвом Лі Хана і Ван Веньцянь були об’єднані і тепер звітують перед Чжоу Чаном.

Кілька осіб, що мають інформацію, повідомили «Інтелектуальний вибух», що група Лі Хана і Ван Веньцянь вивчала переважно VLA, зосереджуючись на «імпровізації» та «реальності», з метою застосування в галузі ембодірованого інтелекту; тоді як нова команда під керівництвом Фан Хаоці розробляє напрямок 3D-симуляції, зосереджуючись на розвагах та іграх.

Крім розширення людських ресурсів і маршрутів дослідження, модель світу також отримує найбільші інвестиції серед таких напрямків моделей, як текст, кодування та відео.

Дуже відзначається бюджет на дані. Працівник платформи ByteDance сказав нам, що стратегія «масового використання» даних, яка раніше принесла значні результати в LLM та Seedance 2.0, тепер планується до застосування у навчанні світових моделей.

Це також відповідає більшим витратам на дані — з різних джерел нам відомо, що в 2026 році бюджет ByteDance на навчання світових моделей (включаючи модальності VLA, довгі відео, 3D тощо) є найвищим серед усіх модальностей і становить кілька мільйонів юанів.

Один із постачальників даних зазначив, що вклади ByteDance у дані для світових моделей можуть досягати 3–4 разів більше, ніж у інших виробників.

Кодування: Досконале володіння інженерією даних — це основа, що визначає верхню межу ефективності агента — це вже загальноприйнята думка в галузі.

Кілька осіб, що мають інформацію, згадували нам про велике значення ByteDance для Coding. «Вклад ByteDance у Coding завжди був високим, поступаючись лише світовим моделям цього року», — сказав хтось, хто має доступ до Seed, виданню «Інтелектуальний вибух».

Наприклад, внутрішній персонал може цільово закуповувати дані або досліджувати тренувальні дані демонстраційних версій таких зарубіжних топових моделей кодування, як Claude Code та CodeX.

На конференції Force 2025 від Volcano Engine, віце-президент з технологій ByteDance Хун Дінкун також зазначив, що кодування, як високо структурована та логічно строга задача, вимагає від моделі розуміння складних семантичних структур, логічного міркування, проектування алгоритмів та точного вираження, що сприяє дослідженню меж інтелекту моделей.

Але за межами компанії присутність бізнесу Coding від ByteDance завжди була слабкою. Як модель Doubao-Seed-Code, випущена в листопаді 2025 року, так і інструмент AI-програмування Trae, випущений на початку 2025 року, не досягли такого ж рівня ефективності та популярності, як GLM 5 від Zhipu та K2 від Moonshot.

«Складно досягти прориву в ефективності кодування ByteDance через відсутність зворотного зв’язку даних», — оцінив один із освідчених. Через обмежені можливості моделі, бізнес-напрямки ByteDance не хочуть використовувати Seed-Code.

Навіть у застосунку AI Coding Trae першими підключеними були DeepSeek і Claude Code, а також власна навчена модель Coding.

Це призводить до того, що модель кодування Byte відсутність зворотного зв’язку з реальних сценаріїв застосування.

З 2026 року багато співробітників ByteDance відчули, що різні бізнес-напрямки збільшують підтримку моделі Seed. Один із співробітників Seed розповів «Інтелектуальному виникненню», що раніше ByteDance не обмежувала бізнес-підрозділи у використанні сторонніх моделей для кодування, але з 2026 року кілька застосункових відділів були зобов’язані використовувати модель Seed.

Проте при більш інтенсивному вкладі в дані швидкість набору персоналу Seed трохи знизилася.

Рекрутер з AI-середовища повідомив «Інтелектуальний вибух», що HR-відділ ByteDance зараз передає такий сигнал: епоха масового найму з високою зарплатою закінчилася, наступна задача — внутрішнє виховання та просування молодих фахівців, підвищення оплати праці алгоритмістів.

Зараз Seed має лише кілька вакансій, які в першу чергу відкриті для фахівців з штучного інтелекту з закордонних великих компаній, таких як DeepSeek, OpenAI, DeepMind та Meta, наприклад, колишні ключові члени DeepSeek Го Дая і колишній дослідник NVIDIA Дон Сінь.

Як Seedance зберігає позицію SOTA: У 2026 році іншим пріоритетом ByteDance у сфері AI-моделей є підтримка позиції Seedance як лідера у галузі генерації відео на глобальному рівні.

«Перемога Seedance 2.0 — це перемога даних», — колись сказав засновник стартапу з відеогенерації журналу «Інтелектуальний вибух» про Seedance 2.0. Нам відомо, що величезний обсяг навчальних даних та команда з понад 2000 оцінювачів зробили ефект Seedance 2.0 таким вражаючим.

Але тривала стратегія навчання за рахунок «обсягу» також має приховані ризики. Деякі дослідження вказують на наявність явища «анти-масштабування» у галузі генерації відео: простими словами, чим більше даних для навчання, тим більше модель «лініє», вчачись лише ключовим кадрам, ігноруючи цілісний сюжет — тому на пізніх етапах навчання вигода від «обсягу» даних зазвичай знижується.

Дві інформовані особи з боку даних повідомили нам, що Seedance досягла верхньої межі у передтренуванні, і для подальшого підвищення продуктивності необхідно очистити навчальні дані та провести більш точне післятренування.

Тим часом «динамічне генерування» є новим напрямком, на який звертає увагу команда Seedance у 2026 році.

Так зване «динамічне генерування», або інтерактивне відео, означає, що користувачі можуть вводити команди та в будь-який момент змінювати зміст та сюжет відео. У цьому сегменті вже з’явилася компанія Vivix AI з оцінкою в 1,32 мільярда доларів США (заснована Люй Юем, колишнім директором з досліджень у SenseTime).

Кілька осіб, що мають інформацію, повідомили «Інтелектуальний вибух», що Чжоу Чан завжди добре ставився до перспектив впровадження динамічного генерування.

«Інтерактивні відео можна перетворити на ігри, а також на інтерактивні серіали, а також поєднати з дослідженнями світових моделей (генерація відео також є одним із напрямків дослідження світових моделей)», — сказав особа, близька до Seed.

Прискорення комерціалізації та виходу на міжнародні ринки Добао. 36Kr раніше виключно повідомляв, що Добао планує офіційно запустити платні контенти в кінці червня; одночасно Добао також планує інтегруватися з електронною комерцією Douyin, щоб удосконалити платні сценарії.

На початку травня 2026 року Doudou оновив пакети платних підписок у App Store, де ціна місячної підписки варіювалася від безкоштовної до 500 юанів.

3 червня офіційний акаунт Доубає також оголосив, що збирається запустити «Доубай Профі» для задоволення продуктивних потреб професіоналів, що включає професійні сервіси, такі як розробка програмного забезпечення, аналіз даних, професійний дизайн, автоматизація процесів, фінансовий аналіз та наукові дослідження.

Кілька осіб, що мають інформацію, повідомили, що після Свят Весни DAU豆包 перевищив 200 мільйонів. «Цього року бюджет на рекламу для 豆包 дуже низький», — вважає одна з осіб, що має інформацію. Високий DAU призводить до високих витрат на обчислення та навантаження на технічну підтримку; запуск комерціалізації 豆包 в цей період має дві мети — знизити темпи зростання та забезпечити самопідтримку.

Генерація PPT є ключовим моментом для формування у користувачів уявлення про платність Доубао. «Доубао хоче посилити функцію генерації PPT, щоб стягувати плату з білосорочкових працівників у високодоходних галузях, таких як фінанси та право», — сказав людина, близька до Доубао, «Інтелектуальний вибух». На наступному етапі Доубао планує запустити корпоративну версію та інтегрувати її з внутрішніми системами компаній, але ще обговорює конкретні способи об’єднання.

Він зазначив, що ця ідея натхненна бізнес-моделями зарубіжних моделей. Наразі шлях монетизації через оплату за сценарії роботи в офісі вже був перевірений за кордоном. За даними Anthropic, Claude Code за шість місяців після запуску досяг ARR у 1 мільярд доларів США; через рік, у лютому 2026 року, ARR вже склав 2,5 мільярда доларів США.

Ощітливий грошовий потік від Claude Code для корпоративних розробницьких сценаріїв дозволив Anthropic, яка була заснована на 6 років пізніше за OpenAI, на початку цього року обігнати ARR OpenAI.

Тепер завдання Доубая полягає в тому, щоб змінити сприйняття користувачів з «універсального входу», де можна безкоштовно запитувати все, на «офісного асистента», який, хоч і коштує грошей, допомагає підвищити ефективність.

Однак ринок, до якого хоче потрапити Доубао, вже переповнений. Представники Доубао згадали Smart Emergence, що під час дослідження корпоративних клієнтів ByteDance виявило, що ринок корпоративних інструментів ШІ вже зайнятий багатьма постачальниками галузевих рішень ШІ, і Доубао, що запізнився, обов’язково зіткнеться з вищими витратами на привернення клієнтів.

«Інтелектуальний вибух» дізнався, що вихід на зарубіжні ринки також є однією з ключових задач Бэйбау цього року.

Раніше, зовнішня версія додатку豆包 Dola до кінця 2025 року досягла DAU понад мільйон. За інформацією «Інтелектуального виникнення», ціль зростання Dola на 2026 рік — досягти 30 мільйонів DAU до кінця року.

За словами джерела, основними ринками для Dola є країни з малими мовами. Наразі зарубіжний ринок AI-чат-ботів майже повністю зайнятий ChatGPT, Claude та Gemini. Уникнення прямих зіткнень з «трійкою AI» на ринках Європи та Північної Америки та диференційований підхід до ринків з малими мовами — це стратегія зростання Dola.

Дані третіх сторін показують, що з другої половини 2025 року Dola неодноразово потрапляла до списків завантажень у магазинах додатків Індонезії, Малайзії, Мексики тощо.

——

За рік, що він працює в ByteDance, Уйонхуей ставив перед собою завдання керувати командою Seed, яка одночасно виправляє баги та розробляє SOTA-моделі. У 2026 році метою ByteDance у кожній галузі штучного інтелекту є стати переможцем.

Зараз Seed 2.0 та Seedance 2.0 демонструють перші результати, а інженерний досвід, дані та кадри, накопичені Seed, будуть ефективніше використані в новій війні.

(Автор книги «Інтелектуальний вибух» Ден Юні зробила внесок у цю статтю.)