A estratégia de IA da ByteDance para 2026 foca em modelos mundiais, Seedance, codificação e comercialização do DouBao

iconMetaEra
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
A estratégia de IA da ByteDance para 2026 inclui modelos mundiais, Seedance, codificação e comercialização do DouBao. A empresa planeja concorrer com o Genie 3 do Google até o final do ano, aumentar a geração de vídeos e expandir ferramentas de codificação. O DouBao terá como alvo produtividade corporativa e notícias de IA + cripto. Fontes internas afirmam que modelos mundiais são uma prioridade máxima, com forte suporte de dados e financiamento. A iniciativa alinha-se às crescentes notícias sobre ativos do mundo real (RWA) e inovação impulsionada por IA.
A estratégia de IA do ByteDance para 2026 foca em quatro áreas principais: modelos mundiais, modelo de vídeo Seedance, codificação e comercialização do DouBao.

Autor do artigo: Zhou Xinyu

Fonte: 36氪

A Smart Emergence obteve exclusivamente de várias fontes que, em 2026, o Byte AI terá quatro grandes temas:

Aumentar o investimento no treinamento de modelos globais; até o final do ano, o desempenho do modelo alcançará o nível atual do melhor modelo global do mundo, o Google Genie 3.

Os modelos de vídeo continuam na liderança, explorando novas direções como a "geração dinâmica".

Fortaleça ainda mais a base em Coding, implemente bem o Dogfooding de Coding (retroalimentação de dados, avaliação, formação de um ciclo virtuoso) e melhore a capacidade do Agent.

Doubao fortalece sua capacidade de comercialização, com foco nos cenários de "escritório".

O território inacabado do ByteDance: Modelos Mundiais. Atualmente, na matriz de IA do ByteDance, há o Seed 2.0, que finalmente permitiu ao ByteDance ingressar no primeiro grupo de modelos grandes da China, e o Seedance 2.0, que alcançou o nível SOTA mundial. Além disso, no lado das aplicações, DouBao também estabeleceu uma liderança decisiva — segundo informações de múltiplas fontes, após o Ano Novo Chinês de 2026, a DAU do DouBao atingiu 200 milhões.

“Não há fraquezas óbvias.” Assim avaliou uma estratégia de IA de uma grande empresa sobre a matriz de negócios de IA do ByteDance.

Mas, entre todos os modelos, falta o elemento-chave para a próxima fase da pesquisa de grandes modelos: modelos de mundo.

Várias pessoas próximas à equipe da Seed nos disseram que o ByteDance é um jogador tardio na corrida dos modelos mundiais. Em 2024, Zhou Chang, que acabara de se juntar ao ByteDance do Alibaba, assumiu a liderança da pesquisa em modelos mundiais.

Mas na época, o julgamento interno era que a rota dos modelos mundiais e os cenários de comercialização ainda não estavam claros, e era mais importante vencer a batalha dos modelos de vídeo.

Até 2025, a ByteDance formou pequenos grupos de pesquisa para explorar a abordagem VLA (Vision-Language-Action) em modelos mundiais. Os líderes eram dois:

Primeiro, Li Hang, chefe do AI Lab do ByteDance — em abril de 2025, o AI Lab como um todo (incluindo a equipe de Robotics) foi integrado ao Seed, com um dos objetivos sendo melhorar a eficiência da comunicação entre modelos e aplicações (inteligência embodiada) — baseando-se principalmente em dados de simulação para o treinamento de modelos mundiais.

O outro é Wang Wenqian, pesquisador multimodal da Seed, que se baseia principalmente em dados naturais para treinamento.

Em 2026, Wu Yonghui estabeleceu finalmente um objetivo claro para o modelo do mundo na reunião completa da Seed: lançar pelo menos uma versão do modelo do mundo até o final de 2026, com desempenho comparável ao atual SOTA mundial — o Genie 3 lançado pelo Google em agosto de 2025.

Mas, conforme o progresso atual, a velocidade de recuperação não é suficiente. Uma pessoa próxima à Seed nos informou que Wu Yonghui já afirmou várias vezes em reuniões internas da Seed que os modelos de linguagem e a inteligência embodiada da ByteDance não atingiram as expectativas.

Outro membro da Seed revelou que, segundo avaliações internas, até o início de 2026, o desempenho geral do modelo do Byte World ainda apresenta uma lacuna de 10% em relação ao SOTA global.

Mas esta batalha representa o futuro.

Por um lado, o mercado de inteligência embodiada, com um valor de pelo menos US$ 100 bilhões, e os cenários de jogos e entretenimento com enorme potencial de expansão estão abaixo do modelo mundial.

Um ex-researcher da Seed nos disse que os cenários anteriores de aplicação dos robôs da ByteDance eram principalmente transporte de itens e manuseio industrial, mas a avaliação interna considerava o teto de mercado relativamente baixo: “Robôs humanoides, com perspectivas de mercado muito mais amplas, são uma direção em que a ByteDance certamente entrará.”

Por outro lado, as abordagens dos modelos mundiais ainda apresentam muitas divergências, incluindo os grupos de geração de vídeo, VLA (modelos visuais-linguísticos-de-ação) e JEPA (previsão de pixels).

“Apostar, com a densidade de talentos e o investimento financeiro em bytes, é altamente provável que vença,” analisou um investidor de IA conosco. “Não apostar, então, certamente levará à derrota.”

Em torno do objetivo de entrar no primeiro escalão mundial, desde 2026, a ByteDance já realizou várias adaptações no treinamento de modelos mundiais.

Segundo a "Emergência Inteligente", após o Ano Novo Chinês de 2026, a Seed criou um novo grupo de pesquisa em modelos mundiais, liderado por Fan Haoqi, ex-pesquisador do FAIR Lab da Meta, que relata a Zhou Chang, responsável pelos modelos multimodais e mundiais da Seed;

Ao mesmo tempo, os dois grupos de pesquisa liderados por Li Hang e Wang Wenqian foram reunidos e passaram a relatar diretamente a Zhou Chang.

Várias fontes informadas disseram à Smart Emergence que o grupo de pesquisa original de Li Hang e Wang Wenqian focava principalmente em VLA, buscando "improvisação" e "realismo", com aplicações-alvo em inteligência embutida; enquanto a nova equipe liderada por Fan Haoqi segue a rota de simulação 3D, destacando aplicações como entretenimento e jogos.

Além do aumento de recursos humanos e da expansão das rotas de exploração, o modelo mundial também recebe o maior investimento financeiro entre as várias direções de modelos, como texto, codificação e vídeo.

O orçamento de dados é muito significativo. Um funcionário da plataforma de dados ByteDance nos informou que a estratégia de “alta volume” de dados de treinamento, que anteriormente gerou ganhos significativos nos LLMs e no Seedance 2.0, planeja aplicar a mesma “tática do oceano de dados” no treinamento de modelos mundiais.

Isso também corresponde a um investimento maior em dados — de acordo com informações de várias fontes, em 2026, o orçamento atribuído pela ByteDance para os dados de treinamento do modelo mundial (incluindo modalidades como VLA, vídeos longos e 3D) foi o mais alto entre todas as modalidades, alcançando milhões de yuans.

Um fornecedor de dados mencionou que o investimento em dados da ByteDance em modelos mundiais pode ser 3 a 4 vezes maior do que o de outras empresas.

Codificação: Buscar habilidades de engenharia de dados ainda mais aprimoradas é fundamental e é o fator determinante para o limite de desempenho do Agente — isso se tornou um consenso na indústria.

Várias fontes informadas nos mencionaram a importância que a ByteDance atribui ao Coding. “A ByteDance sempre investiu muito no Coding, apenas atrás dos modelos mundiais deste ano”, disse uma pessoa próxima à Seed à Intelligent Emergence.

Por exemplo, internamente, há a aquisição direcionada de dados ou a pesquisa de demos de dados de treinamento de modelos de codificação internacionais de ponta, como Claude Code e CodeX.

Na conferência Force da Volcano Engine em 2025, Hong Dingkun, Vice-Presidente de Tecnologia do ByteDance, também afirmou que o Coding, como uma tarefa altamente estruturada e logicamente rigorosa, exige altos níveis de compreensão de estruturas semânticas complexas, raciocínio lógico, design de algoritmos e expressão precisa, contribuindo para a exploração do limite inteligente dos modelos.

No entanto, fora do ambiente interno, a presença do negócio de codificação da ByteDance sempre foi fraca. Tanto o modelo Doubao-Seed-Code, lançado em novembro de 2025, quanto a ferramenta de programação por IA Trae, lançada no início de 2025, tiveram desempenho e visibilidade inferiores aos do GLM 5 da Zhipu e ao K2 da Moonshot.

Um insider avaliou: “A dificuldade em alcançar avanços no desempenho de codificação do ByteDance deve-se à falta de retorno de dados.” Devido à capacidade limitada do modelo, os negócios relacionados ao ByteDance não querem usar o Seed-Code.

Mesmo o aplicativo de codificação por IA Trae, os primeiros a serem integrados foram o DeepSeek e o Claude Code, além do modelo de codificação treinado internamente pelo produto.

Isso resulta no fato de que o modelo de codificação da ByteDance não recebe feedback de cenários reais de aplicação.

Desde 2026, muitos funcionários da ByteDance sentiram que várias equipes de negócios estão aumentando o apoio ao modelo Seed. Um funcionário da Seed informou à Intelligent Emergence que, anteriormente, a ByteDance não restringia as equipes de negócios de usarem modelos de codificação de terceiros para desenvolvimento, mas desde 2026, vários departamentos de aplicativos foram obrigados a usar o modelo Seed.

No entanto, com um investimento ainda mais intenso em dados, a Seed acabou desacelerando um pouco o ritmo de contratação de talentos.

Um recrutador do mundo da IA informou à "Inteligência Emergente" que a mensagem atual do RH do ByteDance é: a era de contratações generosas e de alto salário acabou; o próximo desafio é desenvolver e promover jovens talentos internamente e melhorar a remuneração dos algoritmos.

Atualmente, as poucas vagas de emprego da Seed estão principalmente abertas para profissionais de IA de grandes empresas estrangeiras, como DeepSeek, OpenAI, DeepMind e Meta, como Guo Daya, ex-membro-chave da DeepSeek, e Dong Xin, ex-pesquisador da NVIDIA.

Como a Seedance mantém seu status de SOTA? Em 2026, outro foco do ByteDance em modelos de IA será manter a Seedance na posição de SOTA no campo global de geração de vídeos.

“A vitória do Seedance 2.0 é uma vitória dos dados.” O fundador de uma startup de geração de vídeos avaliou o Seedance 2.0 assim para a “Inteligência Emergente”. Sabemos que a grande quantidade de dados de treinamento e a equipe de avaliação composta por mais de 2.000 pessoas contribuíram para os impressionantes resultados do Seedance 2.0.

No entanto, o método de treinamento baseado apenas em volume também apresenta preocupações ocultas. Alguns estudos indicam a existência do fenômeno da “Lei Anti-Escalabilidade” no campo de geração de vídeos; em termos simples, quanto mais dados de treinamento houver, mais o modelo tende a “preguiçar”, aprendendo apenas alguns quadros-chave e ignorando a narrativa completa — portanto, quanto mais avançado o treinamento, menor se torna o retorno obtido com o aumento de volume de dados.

Duas fontes familiarizadas com os dados nos informaram que a Seedance já atingiu o limite no pré-treinamento; para melhorar o desempenho a seguir, será necessário limpar os dados de treinamento e realizar um pós-treinamento mais refinado.

Ao mesmo tempo, a capacidade de "geração dinâmica" é uma nova direção focada pela equipe da Seedance em 2026.

O chamado “geração dinâmica”, também conhecido como vídeo interativo, refere-se à capacidade do usuário de inserir instruções e ajustar o conteúdo e a trama do vídeo a qualquer momento. Neste segmento, já surgiu a Vivix AI, avaliada em 1,32 bilhão de dólares (fundada por Liu Yu, ex-diretor sênior de pesquisa da SenseTime).

Várias fontes informadas disseram à Smart Emergence que Zhou Chang sempre teve grande confiança no potencial de implementação da geração dinâmica.

“Vídeos interativos podem ser transformados em jogos, também podem ser séries interativas e ainda se alinhar com a exploração de modelos mundiais (a geração de vídeo também é um caminho de exploração dos modelos mundiais),” disse uma pessoa próxima à Seed.

Acelerar a comercialização e a expansão internacional do DouBao A 36Kr relatou exclusivamente que o DouBao está previsto para lançar oficialmente conteúdo pago no final de junho; ao mesmo tempo, o DouBao também planeja integrar-se ao comércio eletrônico do Douyin para aprimorar os cenários de pagamento.

No início de maio de 2026, DouBao atualizou seus planos de assinatura paga na App Store, com preços mensais variando de gratuito a 500 yuan.

Em 3 de junho, o DouBao oficial também anunciou que lançará em breve a versão profissional do DouBao, voltada para as necessidades de produtividade de profissionais, incluindo serviços profissionais como desenvolvimento de software, análise de dados, design profissional, automação de processos, análise financeira e pesquisa científica.

Várias fontes informadas revelaram que, após o Ano Novo Chinês, a DAU do DouBao já ultrapassou 200 milhões. “O orçamento para publicidade do DouBao este ano é muito baixo.” Para uma fonte informada, a alta DAU traz custos elevados de inferência e pressão operacional; o DouBao está avançando na comercialização neste momento com o duplo objetivo de reduzir a taxa de crescimento e promover sua própria sustentabilidade financeira.

A geração de PPT é o ponto de entrada central para criar a percepção de pagamento entre os usuários pelo Doubao. “O Doubao deseja fortalecer a funcionalidade de geração de PPT com o objetivo de cobrar profissionais de setores de alto valor agregado, como finanças e direito”, disse uma pessoa próxima ao Doubao à Smart Emergence. Na próxima fase, o Doubao planeja lançar uma versão empresarial, integrando-se aos sistemas internos das empresas, mas ainda está discutindo as formas específicas de integração.

Ele afirmou que essa ideia foi inspirada pelo modelo de negócios no exterior. Atualmente, o caminho de monetização com cobrança para cenários de escritório já foi validado no exterior. Segundo dados divulgados pela Anthropic, o Claude Code atingiu um ARR de US$ 1 bilhão em apenas seis meses após o lançamento; um ano após o lançamento, em fevereiro de 2026, o ARR já havia alcançado US$ 2,5 bilhões.

O fluxo de caixa significativo gerado pelo Claude Code para cenários de desenvolvimento empresarial permitiu que a Anthropic, fundada seis anos após a OpenAI, superasse a ARR da OpenAI no início deste ano.

Agora, o problema que DouBao precisa resolver é transformar a percepção dos usuários de um “portal geral” onde se pode perguntar tudo gratuitamente para um “assistente de trabalho” que, embora exija pagamento, ajuda a aumentar a eficiência.

No entanto, o mercado que o DouBao deseja entrar já está saturado. Pessoas da DouBao mencionaram à Smart Emergence que, durante a pesquisa de clientes corporativos, a ByteDance descobriu que o mercado de ferramentas de IA corporativas já foi ocupado por diversos fornecedores de soluções de IA setoriais, e o tardio DouBao certamente enfrentará custos mais altos para aquisição de clientes.

《Intelligent Emergence》 soube que a expansão internacional também é uma das principais prioridades do DouBao este ano.

Anteriormente, a versão internacional do aplicativo Dola já ultrapassou 10 milhões de DAU até o final de 2025. Segundo o "Intelligent Emergence", a meta de crescimento da Dola para 2026 é atingir 30 milhões de DAU até o final do ano.

Uma fonte informada afirmou que os países de línguas minoritárias são o mercado principal da Dola. Atualmente, o mercado externo de chatbots de IA já está praticamente dominado pelo ChatGPT, Claude e Gemini. Evitar confronto direto com as “três grandes da IA” nos mercados europeu e norte-americano e entrar de forma diferenciada nos mercados de línguas minoritárias é a estratégia de crescimento da Dola.

Dados de terceiros mostram que, desde o segundo semestre de 2025, a Dola frequentemente apareceu nas listas de downloads das lojas de aplicativos da Indonésia, Malásia, México e outros países.

——

Desde que se juntou ao ByteDance há um ano, o desafio de Wu Yonghui tem sido liderar a equipe Seed a corrigir bugs e desenvolver modelos SOTA ao mesmo tempo. Em 2026, em cada campo da IA, o objetivo do ByteDance é ser o vencedor.

Hoje, o Seed 2.0 e o Seedance 2.0 já mostram resultados iniciais, e a experiência em engenharia, dados e talentos acumulados pelo Seed será reutilizada de forma mais eficiente na nova guerra.

(A autora de "Intelligent Emergence", Deng Yongyi, também contribuiu para este artigo.)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.