La estrategia de IA de ByteDance para 2026 se centra en modelos mundiales, Seedance, programación y la comercialización de DouBao

iconMetaEra
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
La estrategia de IA de ByteDance para 2026 incluye modelos mundiales, Seedance, programación y la comercialización de DouBao. La empresa planea competir con Genie 3 de Google antes de fin de año, mejorar la generación de video y expandir sus herramientas de programación. DouBao se enfocará en la productividad de oficina y noticias de IA + cripto. Fuentes internas indican que los modelos mundiales son una prioridad máxima, con un fuerte respaldo en datos y financiamiento. Este movimiento se alinea con las crecientes noticias sobre activos del mundo real (RWA) y la innovación impulsada por IA.
La estrategia de IA de ByteDance para 2026 se centra en cuatro áreas: modelos de mundo, modelo de video Seedance, codificación y comercialización de DouBao.

Autor del artículo: Zhou Xinyu

Fuente: 36氪

《Intelligent Emergence》 obtuvo exclusivamente de múltiples fuentes que, en 2026, ByteDance AI tendrá cuatro proposiciones importantes:

Aumentar la inversión en el entrenamiento de modelos mundiales; para fin de año, el rendimiento del modelo alcanzará el nivel actual del mejor modelo mundial global, Google Genie 3.

Los modelos de video mantienen su liderazgo y exploran nuevas direcciones como la "generación dinámica".

Fortalecer aún más la base de Coding, implementar bien el Dogfooding de Coding (retroalimentación de datos, evaluación, formar un ciclo de retroalimentación) y mejorar la capacidad del Agent.

Doubao refuerza su capacidad de comercialización, con los escenarios clave en "oficina".

El territorio inexplorado de ByteDance: Modelos mundiales. En la matriz de IA de ByteDance, ahora hay Seed 2.0, que permite a ByteDance ingresar finalmente al primer grupo de modelos grandes en China, y Seedance 2.0, que alcanza el nivel SOTA mundial. Además, en el lado de las aplicaciones, DouBao ha logrado una ventaja abrumadora: según información de múltiples fuentes, después del Año Nuevo Chino de 2026, el DAU de DouBao alcanzó 200 millones.

“No tiene deficiencias evidentes.” Así evaluó un estratega de IA de una gran empresa la matriz de negocios de IA de ByteDance.

Pero entre todos los modelos, falta el clave para la siguiente fase de la investigación de grandes modelos: los modelos del mundo.

Varias personas cercanas al equipo de Seed nos informaron que ByteDance es un jugador tardío en la carrera de los modelos mundiales. En 2024, Zhou Chang, recién llegado de Alibaba a ByteDance, asumió la liderazgo de la investigación de modelos mundiales.

Pero en ese momento, el juicio interno fue que la ruta del modelo mundial y los escenarios de comercialización aún no estaban claros, y lo más importante era ganar la batalla de los modelos de video.

Hasta 2025, ByteDance formó un pequeño equipo de investigación para explorar la ruta VLA (modelo visual-lenguaje-acción) en modelos del mundo. Los líderes del equipo son dos:

En primer lugar, Li Hang, responsable del AI Lab de ByteDance: en abril de 2025, el AI Lab en su conjunto (incluido el equipo de Robotics) se integró en Seed, uno de los objetivos era mejorar la eficiencia de la comunicación entre los modelos y las aplicaciones (inteligencia encarnada), basándose principalmente en datos de simulación para el entrenamiento de modelos del mundo.

El otro es Wang Wenqian, investigador multimodal de Seed, que se enfoca principalmente en el entrenamiento con datos naturales.

Al llegar a 2026, Wu Yonghui estableció finalmente un objetivo claro para el modelo del mundo en la reunión completa de Seed: lanzar al menos una versión del modelo del mundo antes de finales de 2026, con un rendimiento comparable al actual SOTA mundial — Genie 3 lanzado por Google en agosto de 2025.

Pero según el progreso actual, la velocidad de追赶 es insuficiente. Una persona cercana a Seed nos dijo que Wu Yonghui ha mencionado repetidamente en reuniones internas de Seed que los modelos de mundo y la inteligencia encarnada de ByteDance no han cumplido con las expectativas.

Otro miembro de Seed reveló que, según la evaluación interna, hasta principios de 2026, el modelo del mundo de ByteDance aún presenta un 10% de diferencia con respecto al SOTA global.

Pero esta batalla representa el futuro.

Por un lado, el mercado de inteligencia encarnada, con un volumen de al menos mil millones de dólares estadounidenses, y los escenarios de juegos y entretenimiento con un enorme potencial de crecimiento se encuentran aguas abajo del modelo del mundo.

Un ex investigador de Seed nos indicó que los escenarios de implementación anteriores del robot de ByteDance se centraban principalmente en el transporte de artículos y la manipulación industrial, pero la empresa internamente consideró que el techo de mercado era bajo: “Los robots humanoides, con un prospecto de mercado mucho más amplio, son una dirección en la que ByteDance sin duda entrará.”

Por otro lado, las líneas del modelo mundial aún presentan numerosas divergencias, incluyendo a los partidarios de la generación de video, los defensores de VLA (modelos visuales-lingüísticos-accionales) y los seguidores de JEPA (predicción de píxeles).

“Apostar, por la densidad de talento y la inversión de capital en bytes, es muy probable que ganes,” analizó un inversionista de IA. “No apostar, en cambio, significa perder con certeza.”

En torno al objetivo de ubicarse entre los primeros del mundo, desde 2026, ByteDance ha realizado numerosos ajustes en el entrenamiento de modelos mundiales.

Según "Emergencia Inteligente", después del Año Nuevo Chino de 2026, Seed estableció un nuevo grupo de investigación de modelos mundiales, liderado por Fan Haoqi, exinvestigador del laboratorio FAIR de Meta, quien informa a Zhou Chang, responsable de multimodalidad y modelos mundiales de Seed;

Meanwhile, the two VLA research teams led by Li Hang and Wang Wenqian were merged and now report uniformly to Zhou Chang.

Varias fuentes informadas le dijeron a Smart Emergence que el grupo de investigación de Li Hang y Wang Wenqian exploraba principalmente la línea VLA, persiguiendo la "improvisación" y la "realidad", con aplicaciones objetivo en inteligencia encarnada; mientras que el nuevo equipo liderado por Fan Haoqi se enfocó en la ruta de simulación 3D, destacando aplicaciones como entretenimiento y juegos.

Además de la expansión de mano de obra y rutas de exploración, el modelo mundial también recibe la mayor inversión financiera entre las múltiples direcciones de modelos, como texto, codificación y video.

Es notable el presupuesto de datos. Un empleado de la plataforma de datos Byte nos dijo que la estrategia de “alto volumen” de datos de entrenamiento, que anteriormente generó beneficios significativos en los LLM y Seedance 2.0, tiene previsto aplicar la misma “táctica del océano de datos” en el entrenamiento de modelos mundiales.

Esto también se traduce en una inversión de datos más elevada: según información obtenida de múltiples fuentes, en 2026, ByteDance asignó el mayor presupuesto entre todos los modalidades para los datos de entrenamiento del modelo mundial (incluyendo VLA, videos largos, 3D, etc.), alcanzando varios millones de yuanes.

Un proveedor de datos mencionó que el gasto de datos de ByteDance en modelos mundiales puede alcanzar de 3 a 4 veces el de otros fabricantes.

Codificación: Perfeccionar las habilidades de ingeniería de datos es fundamental y es lo que determina el límite superior del rendimiento del agente: esto se ha convertido en un consenso en la industria.

Varias personas informadas nos mencionaron la importancia que ByteDance otorga a Coding. “La inversión de ByteDance en Coding ha sido siempre muy alta, solo superada por el modelo mundial de este año”, dijo una persona cercana a Seed a Inteligencia Emergente.

Por ejemplo, internamente se realizarán compras dirigidas de datos o se investigarán demos de datos de entrenamiento de modelos de codificación líderes en el extranjero como Claude Code y CodeX.

En la conferencia Force de Volcán Engine 2025, Hong Dingkun, vicepresidente técnico de ByteDance, también indicó que Coding, como una tarea altamente estructurada y lógicamente rigurosa, exige un alto nivel de comprensión de estructuras semánticas complejas, razonamiento lógico, diseño de algoritmos y expresión precisa, lo que puede impulsar la exploración del límite inteligente de los modelos.

Sin embargo, fuera de la empresa, la presencia del negocio de codificación de ByteDance ha sido siempre débil. Tanto el modelo Doubao-Seed-Code lanzado en noviembre de 2025 como la herramienta de programación AI Trae lanzada a principios de 2025 han tenido un impacto y una visibilidad inferiores a los de GLM 5 de Zhipu y K2 de Moonshot.

Un conocido evaluó: “La razón por la que el rendimiento de Coding de ByteDance es difícil de mejorar es la falta de retroalimentación de datos”. Debido a las limitaciones del modelo, los negocios relacionados con ByteDance no quieren utilizar Seed-Code.

Incluso la aplicación de codificación por IA Trae, los primeros en integrarse fueron DeepSeek y Claude Code, así como el modelo de codificación entrenado internamente por el producto.

Esto hace que el modelo de codificación de bytes carezca de retroalimentación de escenarios de aplicación reales.

Desde 2026, muchos empleados de ByteDance han percibido que diversos equipos de negocio están aumentando el apoyo al modelo Seed. Un empleado de Seed le dijo a "Intelligent Emergence" que anteriormente ByteDance no restringía a los equipos de negocio para usar modelos de codificación de terceros en el desarrollo, pero desde 2026, varios departamentos de aplicaciones han sido obligados a utilizar el modelo Seed.

Sin embargo, con una inversión de datos aún más intensa, la velocidad de contratación de talento de Seed se ha ralentizado un poco.

Un headhunter del mundo de la IA le dijo a "Intelligent Emergence" que la señal que el departamento de RRHH de ByteDance está enviando actualmente es que la era de la contratación masiva y con altos salarios ha terminado; el próximo desafío es fomentar y promover a jóvenes talentos internamente y mejorar la compensación de los algoritmos.

Actualmente, las pocas posiciones de reclutamiento de Seed se han abierto principalmente a talentos de IA de grandes empresas extranjeras como DeepSeek, OpenAI, DeepMind y Meta, por ejemplo, Guo Daya, ex miembro clave de DeepSeek, y Dong Xin, ex investigador de NVIDIA.

Seedance cómo mantener su posición SOTA. En 2026, otro enfoque de ByteDance en modelos de IA será mantener la posición SOTA de Seedance en el ámbito global de la generación de video.

“El éxito de Seedance 2.0 es un triunfo de los datos.” El fundador de una startup de generación de videos le dijo así a “Intelligent Emergence” sobre Seedance 2.0. Sabemos que la gran cantidad de datos de entrenamiento y un equipo de evaluación de más de 2,000 personas lograron los impresionantes resultados de Seedance 2.0.

Sin embargo, el enfoque de entrenamiento basado únicamente en la cantidad de datos también presenta preocupaciones ocultas. Algunos estudios revelan un fenómeno conocido como "Ley Anti-Escalado" en el campo de la generación de videos; en términos simples, cuanto más datos se utilizan para el entrenamiento, más probable es que el modelo "se relaje", aprendiendo solo ciertos fotogramas clave y descuidando la narrativa completa, por lo que, a medida que avanza el entrenamiento, los beneficios de aumentar la cantidad de datos tienden a disminuir.

Dos fuentes informadas del lado de los datos nos indicaron que Seedance ya ha alcanzado el límite en la preentrenamiento; para mejorar el rendimiento a continuación, es necesario limpiar los datos de entrenamiento y realizar un postentrenamiento más refinado.

Al mismo tiempo, la capacidad de "generación dinámica" es una nueva dirección de enfoque para el equipo de Seedance en 2026.

Lo que se denomina “generación dinámica”, también conocido como video interactivo, se refiere a que los usuarios pueden ingresar instrucciones para ajustar en tiempo real el contenido y la trama del video. En este sector, ya ha emergido Vivix AI, con una valoración de hasta 1.320 millones de dólares, fundada por Liu Yu, exdirector de investigación senior en SenseTime.

Varias fuentes informadas dijeron a Smart Emergence que Zhou Chang siempre ha tenido una gran confianza en el potencial de implementación de la generación dinámica.

“Los videos interactivos pueden convertirse en juegos pequeños, en series interactivas, y también pueden conectarse con la exploración de modelos del mundo (la generación de videos es también una vía de exploración de los modelos del mundo).” dijo una persona cercana a Seed.

Acelerar la comercialización y la expansión internacional de DouBao. 36Kr informó exclusivamente que DouBao lanzará oficialmente contenido de pago a finales de junio; al mismo tiempo, DouBao también planea integrarse con el comercio electrónico de Douyin para completar los escenarios de pago.

A principios de mayo de 2026, Doubao actualizó sus planes de suscripción de pago en App Store, con precios mensuales que varían entre gratis y 500 yuanes.

El 3 de junio, el equipo oficial de Doubao también anunció que pronto lanzará "Doubao Professional", diseñado para satisfacer las necesidades de productividad de profesionales, e incluirá servicios profesionales como desarrollo de software, análisis de datos, diseño profesional, automatización de procesos, análisis financiero e investigación científica.

Varias fuentes informadas revelaron que, después del Año Nuevo Chino, la DAU de Doubao ya superó los 200 millones. “Este año, el presupuesto de publicidad de Doubao es muy bajo.” Para una fuente informada, la alta DAU conlleva costos elevados de inferencia y presión operativa; por lo tanto, Doubao está impulsando su comercialización en este momento con el doble objetivo de reducir la velocidad de crecimiento y lograr autosuficiencia financiera.

La generación de PPT es el punto de entrada clave para que Doubao establezca la mentalidad de pago entre los usuarios. "Doubao desea fortalecer la función de generación de PPT con el fin de cobrar a profesionales de industrias de alto valor, como finanzas y derecho", dijo una persona cercana a Doubao a "Inteligencia Emergente". En la próxima fase, Doubao planea lanzar una versión empresarial que se integre con los sistemas internos de las empresas, aunque aún están discutiendo internamente las formas específicas de integración.

Él indicó que esta idea se inspiró en el modelo de negocio de los países extranjeros. Actualmente, la vía de comercialización que consiste en cobrar por escenarios de oficina ya ha sido validada en el extranjero. Según los datos revelados por Anthropic, Claude Code alcanzó un ARR de 1.000 millones de dólares en solo seis meses desde su lanzamiento; un año después, en febrero de 2026, el ARR ya había llegado a 2.500 millones de dólares.

El flujo de efectivo significativo generado por Claude Code para escenarios de desarrollo empresarial permitió que Anthropic, fundada seis años después que OpenAI, superara en enero de este año el ARR de OpenAI.

Ahora, el problema que DouBao debe resolver es transformar la percepción de los usuarios de un "portal general" donde se pueden hacer preguntas gratuitas sobre todo, en un "asistente de oficina" que, aunque requiere pago, ayuda a aumentar la eficiencia.

Sin embargo, el mercado al que DouBao desea ingresar ya está saturado. Algunos miembros de DouBao mencionaron a Smart Emergence que, durante la investigación de clientes empresariales, ByteDance descubrió que el mercado de herramientas de IA empresarial ya ha sido ocupado por numerosos proveedores de soluciones de IA industriales, lo que significa que DouBao, al llegar tarde, enfrentará costos de adquisición de clientes más altos.

《Intelligent Emergence》 ha aprendido que la expansión internacional también es una de las principales prioridades de DouBao este año.

Anteriormente, la aplicación internacional de Doubao, Dola, superó los 10 millones de DAU a finales de 2025. Según Smart Emergence, el objetivo de crecimiento de Dola para 2026 es alcanzar 30 millones de DAU a fin de año.

Una fuente informada indicó que los países de idiomas minoritarios son el mercado principal al que apunta Dola. Actualmente, el mercado internacional de chatbots de IA ya está prácticamente dominado por ChatGPT, Claude y Gemini. Evitar la competencia directa con los “tres grandes de la IA” en los mercados de EE. UU. y Europa, y enfocarse de manera diferenciada en los mercados de idiomas minoritarios, es la estrategia de crecimiento de Dola.

Los datos de terceros muestran que, desde el segundo semestre de 2025, Dola ha aparecido repetidamente en las listas de descargas de las tiendas de aplicaciones de Indonesia, Malasia, México y otros países.

——

Desde que se unió a ByteDance hace un año, el objetivo de Wu Yonghui ha sido liderar a Seed mientras corrige errores y desarrolla modelos SOTA. En 2026, en cada campo de la IA, el objetivo de ByteDance es ser el ganador.

Actualmente, Seed 2.0 y Seedance 2.0 ya muestran resultados iniciales, y la experiencia en ingeniería, datos y talento acumulada por Seed se reutilizará de manera más eficiente en la próxima guerra.

(La autora de "Intelligent Emergence", Deng Yongyi, también contribuyó a este artículo.)

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.