A generalização do Coding Agent para cenários gerais é uma competição de nível de sistema.

Autor e fonte do artigo: Narrowcast AI

Para o campo da IA, esta foi uma semana repleta de grandes notícias. Desde que Jensen Huang redefiniu o AI PC, até a Microsoft anunciar no Build 2026 a abordagem “Agent-first”, a OpenAI declarar a fusão do ChatGPT e do Codex, além da revelação do progresso do Agente do WeChat, o Qwen começar a integrar Skills de terceiros, o Doubao responder aos rumores sobre pagamento e o Meituan enfatizar na reunião de resultados que os serviços de IA Agent estão se tornando cada vez mais importantes.

Antes, alguém perguntou por que ninguém mais menciona o OpenClaw, que antes foi tão popular? As notícias divulgadas esta semana responderam a essa pergunta com ações reais — as pessoas deixaram de falar sobre o OpenClaw porque o Coding Agent se tornou uma solução universal para execução de tarefas, integrando-se aos chatbots, enquanto ao mesmo tempo se constrói um ecossistema de habilidades e agentes correspondentes, e novas pesquisas pagas também estão em andamento.

Grandes empresas estão transformando as lições aprendidas com o OpenClaw em avanços reais nos negócios. Nesse processo, o OpenClaw e os produtos que vemos agora provavelmente não serão a forma final dos produtos de IA. Como o cientista-chefe de IA da Tencent, Yao Shunyu, disse na Conferência de Aplicações Industriais de IA da Tencent Cloud 2026, uma transformação de longo prazo acabou de começar, e as formas reais de produtos, oportunidades comerciais e maneiras de uso ainda estão longe de serem plenamente inventadas.

O que podemos afirmar é que os Agentes estão se tornando o campo de batalha central da IA das grandes empresas, e a forma dessa competição está evoluindo constantemente ao longo de quatro linhas principais: quem conseguir expandir mais cenários de produtividade para usuários; quem conseguir integrar mais profundamente seus produtos internos; quem conseguir construir um ecossistema de Skill e Agentes suficientemente rico; quem conseguir acumular suficiente contexto.

Os "colegas" tornam-se o ponto focal da competição entre Agentes

“Colega” é o termo mais frequentemente mencionado atualmente para descrever Agentes. O Scout da Microsoft foi projetado para trabalhar “como um colega”; o Botão 3.0 enfatiza a colaboração entre humanos e equipes de IA; os plug-ins de Agentes lançados pela OpenAI são descritos como “novos colegas que já completaram a contratação e conhecem todos os processos”.

Essas afirmações significam que os cenários de produtividade se tornaram o foco da competição entre grandes empresas em Agentes.

O Scout, lançado pela Microsoft, é um agente construído sobre o framework OpenClaw, integrado ao Microsoft 365, capaz de operar no Teams e colaborar com aplicativos de produtividade como Outlook e OneDrive, navegando em e-mails, calendários e mensagens de trabalho, além de automatizar a resolução de conflitos de reuniões, redigir respostas e avançar tarefas. Ao mesmo tempo, a Microsoft lançou o Agent 365 para gerenciar unificadamente a identidade, permissões, políticas e riscos dos agentes nas empresas.

A OpenAI definiu diretamente o tema da apresentação como "Intelligence at Work". Nesta apresentação, a OpenAI realizou três atualizações principais no Codex: lançou plugins Agent com capacidade personalizável; expandiu a capacidade de edição de anotações locais de código e páginas da web para documentos, planilhas e apresentações do PowerPoint; e introduziu a capacidade de gerar sites para relatórios de produção.

Ao mesmo tempo, o DouBao mencionou, em sua resposta sobre funcionalidades pagas, que planeja lançar a versão profissional do DouBao, que incluirá serviços profissionais como desenvolvimento de software, análise de dados, design profissional, automação de processos, análise financeira e pesquisa científica.

Essas ações de produto significam que o valor substancial dos cenários de produtividade — e não apenas dos cenários empresariais tradicionais — já foi comprovado com dinheiro real.

Dados divulgados pela OpenAI mostram que, desde fevereiro deste ano, a ativação semanal do Codex aumentou seis vezes, atingindo 5 milhões, sendo que o crescimento entre profissionais de conhecimento foi três vezes maior do que entre desenvolvedores. A receita da Anthropic no segundo trimestre deve mais que dobrar, chegando a US$ 10,9 bilhões, com possível lucro operacional de US$ 559 milhões, sendo a maior parte da receita proveniente de empresas e startups.

A integração e conexão de produtos internos estão sendo aprofundadas continuamente

As atualizações e iterações do produto correspondem a uma reestruturação mais profunda da arquitetura do produto. Por um lado, as grandes empresas já implementaram chatbots e um ou mais produtos de agentes, e agora a integração desses produtos já começou. O mais ousado é a integração da OpenAI entre o ChatGPT e o Codex.

A OpenAI deseja elevar o ChatGPT de uma simples interface de conversa para uma interface principal de trabalho com Agentes colaborativos, enquanto o Codex será aprimorado para se tornar uma plataforma de Agentes universais capaz de atender às necessidades de trabalho em múltiplos cenários, como escritório, pesquisa científica, processos empresariais, análise de dados e operações comerciais, cujo núcleo é a generalização dos cenários de uso do Coding Agent. Por meio dessa integração, a OpenAI espera推广 o Codex para a vasta base de usuários do ChatGPT, ampliando seu número de usuários pagantes.

Também há relatos de que a OpenAI planeja integrar o navegador AI Atlas a este ecossistema de aplicações de IA avançada.

Por outro lado, a integração envolve a capacidade e os serviços de produtos de internet das grandes empresas, que estão sendo rapidamente incorporados a produtos de IA na forma de Skill ou Agent. A Alibaba adicionou ao Qwen funcionalidades como pedir comida, chamar um táxi e comprar no Taobao, sendo uma das primeiras explorações nesse sentido. Atualmente, podemos ver que ByteDance, Meituan e Tencent também estão realizando trabalhos semelhantes.

Após conectar o DouBao à loja do Douyin, o ByteDance está aumentando as recomendações de lojas e pacotes de promoção para serviços locais, como alimentação, ingressos de cinema e acomodações locais. Na reunião de resultados financeiros, a Meituan afirmou que o assistente de IA "Xiao Tuan" foi integrado ao aplicativo Meituan e atendeu mais de 100 milhões de usuários durante o feriado de 1º de maio, cobrindo cenários como alimentação, lazer, transporte e consultas médicas. O Tencent Docs também transformou as capacidades de processamento de documentos acumuladas anteriormente em Skills, chamadas pelo WorkBuddy.

Durante a Conferência de Aplicações Industriais de IA da Tencent Cloud 2026, Tang Daosheng, Vice-Presidente Executivo Sênior do Grupo Tencent, afirmou que muitas funcionalidades de aplicações tradicionais precisam ser convertidas em capacidades acessíveis por agentes inteligentes para liberar ainda mais o valor acumulado ao longo dos anos. Por isso, este ano, WeCom está abrindo algumas de suas capacidades de dados por meio de interfaces e Skills, permitindo que outros agentes inteligentes as utilizem. Essa tendência de abertura está se tornando cada vez mais evidente.

A construção do ecossistema de terceiros começou a ser priorizada

Uma diferença central do Agente em relação aos produtos anteriores é sua capacidade de chamar ferramentas. Isso exige que o Agente tenha, por trás, um ecossistema de ferramentas suficientemente rico. Mesmo grandes empresas têm dificuldade em construir esse ecossistema sozinhas. É necessário o desenvolvimento de ecossistemas de Skill ou Agente por terceiros.

A construção deste ecossistema já foi colocada na agenda.

Após concluir a integração dos produtos e serviços de primeira parte da Alibaba, o Qwen anunciou que abrirá totalmente aos Agentes e Habilidades de terceiros, permitindo que todas as empresas operem seus próprios Agentes de marca no Qwen. Esta semana, Luckin Coffee, KFC, Mixue Ice Cream & Tea e China Eastern Airlines já lançaram Habilidades no Qwen. Em seguida, as empresas poderão personalizar a identidade e os serviços específicos dos seus Agentes no Qwen.

O Tencent, por um lado, está integrando o Xiao Mei do Meituan ao Yuanbao, oferecendo aos usuários serviços como pedidos de entrega e entrega de refeições; por outro lado, está acelerando a construção do ecossistema de Agentes do WeChat.

Relatos da mídia indicam que o agente do WeChat já concluiu os testes de protótipo e poderá iniciar, já neste mês, o processo de aprovação regulatória antes do lançamento público. Esse agente pode orquestrar miniaplicativos do WeChat para oferecer serviços compostos, como pedir comida, chamar táxi, reservar ingressos, fazer compras e serviços locais.

Além disso, o WeChat também está tentando estabelecer conexões Agent para Agent com fabricantes de celulares como Honor e Xiaomi, permitindo que suas capacidades básicas sejam chamadas pelos Agents dos fabricantes de celulares. Ou seja, os fabricantes de celulares também se tornarão novas entradas para o ecossistema de Agent do WeChat, formando uma arquitetura em que múltiplas entradas compartilham um único ecossistema de Agent.

Os plugins de agente da OpenAI podem empacotar todas as ferramentas, conhecimentos e habilidades necessárias para uma função em um único pacote. Por exemplo, o plugin de produção criativa pode gerar campaign board, variações de anúncios, imagens de estilo de vida do produto e coleções de imagens para e-commerce, além de poder invocar ferramentas como Figma, Canva, Shutterstock, Picsart e Fal. Em termos simples, trata-se de um sistema de transmissão profissional preparado para agentes.

Atualmente, os plug-ins de Agent do Codex cobrem 62 aplicativos populares e 110 habilidades. Em seguida, a OpenAI pretende abrir o ecossistema de plug-ins para parceiros, permitindo que terceiros criem e implantem seus próprios plug-ins diretamente no Codex e no ChatGPT.

O contexto torna-se ainda mais importante

Yao Shunyu afirmou que os modelos estão ficando cada vez melhores em transformar entradas complexas em saídas, mas desde que recebam entradas suficientemente boas. Isso exige que, no lado do usuário, sejam fornecidas ao modelo e ao agente informações suficientemente detalhadas e úteis, permitindo que o modelo e o agente compreendam perguntas que ancoram o caminho correto, como “Quem você é?”, “O que você está fazendo?” e “Que tipo de resposta é valiosa para você?”.

No desenvolvimento, em torno do desenvolvimento de produtos de IA, também é necessário um diálogo contextual adequado. Yao Shunyu e Tang Daosheng mencionaram na conversa acima que o desenvolvimento de produtos de IA deve determinar, com base no feedback do produto, o que o modelo deve recompensar ou punir, o que constitui uma boa resposta e qual comportamento é considerado ruim. Isso significa que as equipes de modelo e de produto precisam realizar um processo de compartilhamento contextual para realizar o Co-Design e criar juntas uma experiência ainda melhor.

Portanto, os produtos de IA devem se conectar e acumular informações contextuais de múltiplas fontes no lado do usuário, alinhando-se à intenção da tarefa com o agente ao determinar quais informações devem ou não ser fornecidas; no lado do desenvolvimento, é necessário estabelecer um mecanismo de feedback fluido para alinhar os objetivos de desenvolvimento das equipes de modelo e de produto, acelerando a otimização da experiência.

Tanto o acúmulo de contexto no lado do usuário quanto a partilha de contexto no lado do desenvolvimento não são apenas problemas de desenvolvimento, mas também problemas organizacionais, que devem ser resolvidos por meio de colaboração para alcançar o acúmulo e a partilha de contexto.

É por isso que, em janeiro deste ano, a OpenAI reorganizou sua equipe para promover uma colaboração mais próxima entre a equipe de produtos e os pesquisadores responsáveis pelos modelos subjacentes relacionados; posteriormente, integrou as equipes do ChatGPT, Codex e API em um único departamento, sob a responsabilidade de Thibault Sottiaux.

Ao mesmo tempo, a ênfase no contexto pode estimular a agentização de hardware, tornando o hardware um meio eficaz para os agents coletarem o contexto do usuário. O projeto Solara da Microsoft está realizando essa exploração. A comunicação em qualquer lugar e a qualquer momento não é o único objetivo do desenvolvimento de terminais de desktop e dispositivos portáteis para agents; o principal objetivo é fornecer mais informações contextuais para os agents executarem tarefas em cenários de desktop e móvel.

Nos últimos anos, a indústria de IA apresentou um caminho técnico relativamente claro: pré-treinamento → pós-treinamento → Agente → Agente de Codificação. Esse caminho pode não ser a única linha principal do futuro, mas é a mais eficaz que as grandes empresas podem capturar atualmente.

As quatro tendências que extraímos são coordenadas básicas interligadas em caminhos fixos, todas destinadas a permitir que o Coding Agent se generalize para cenários gerais. Mais uma vez, trata-se de uma competição de nível sistêmico.

A competição do Big Tech evolui ao longo de quatro direções principais

Os "colegas" tornam-se o ponto focal da competição entre Agentes

A integração e conexão de produtos internos estão sendo aprofundadas continuamente

A construção do ecossistema de terceiros começou a ser priorizada

O contexto torna-se ainda mais importante