La generalización del Coding Agent a escenarios generales es una competencia a nivel de sistema.

Autor y fuente del artículo: Narrowcast AI

Para el campo de la inteligencia artificial, esta semana ha sido de anuncios de gran importancia. Desde que Jensen Huang redefine la PC de IA, hasta que Microsoft en Build 2026 grita "Agent first", OpenAI anuncia la fusión de ChatGPT y Codex, además de que se revelan avances en el agente de WeChat, Qwen comienza a integrarse con habilidades de terceros, Doubao responde a los rumores sobre pagos, y en la reunión de resultados de Meituan se enfatizó que los agentes de IA para servicios se vuelven cada vez más importantes.

Antes, alguien preguntaba por qué nadie mencionaba ya a OpenClaw, que antes fue tan popular. Los mensajes de esta semana responden a esa pregunta con hechos: ya no se habla de OpenClaw porque Coding Agent se ha convertido en una solución general para ejecutar tareas, se está integrando con los chatbots, y al mismo tiempo se está construyendo un ecosistema de habilidades y agentes asociados, además de que ya se están llevando a cabo nuevas exploraciones de pago.

Las grandes empresas están transformando las lecciones aprendidas de OpenClaw en avances empresariales reales. Durante este proceso, OpenClaw y los productos que vemos actualmente probablemente no serán la forma final de los productos de IA. Como dijo Yao Shunyu, científico jefe de IA de Tencent, en la Conferencia sobre Aplicaciones Industriales de IA de Tencent Cloud 2026, acaba de comenzar una transformación de largo plazo, y las formas de producto, oportunidades comerciales y formas de uso reales aún no se han inventado plenamente.

Lo que podemos determinar es que los agentes están convirtiéndose en el campo de batalla central de la IA de las grandes empresas, y la forma de esta competencia está evolucionando constantemente a lo largo de cuatro líneas principales: quién puede ampliar los escenarios de productividad para más usuarios; quién puede integrar más profundamente sus productos internos; quién puede construir un ecosistema de habilidades y agentes lo suficientemente rico; y quién puede acumular suficiente contexto.

Los "colegas" se convierten en el punto focal de la competencia de los Agentes

“Colleague” es el término más utilizado actualmente para describir a los Agentes. Microsoft diseñó a Scout para trabajar “como un colega”; Button 3.0 enfatiza la colaboración entre humanos y equipos de IA; y el plugin de Agent de OpenAI se describe como un “nuevo colega que ya completó su incorporación y conoce todos los procesos”.

Estas expresiones significan que los escenarios de productividad se han convertido en el foco de la competencia entre las grandes empresas en el ámbito de los Agentes.

Scout, lanzado por Microsoft, es un agente construido sobre el marco OpenClaw, integrado en Microsoft 365, que puede ejecutarse en Teams y colaborar con aplicaciones de oficina como Outlook y OneDrive, navegando correos electrónicos, calendarios y mensajes laborales, y gestionando automáticamente conflictos de reuniones, redactando respuestas y avanzando tareas. Además, Microsoft ha lanzado Agent 365 para la gestión unificada de identidades, permisos, políticas y riesgos de los agentes en empresas.

OpenAI también denominó directamente el tema del evento como «Intelligence at Work». En este evento, OpenAI realizó tres actualizaciones principales para Codex: lanzó plugins de agente con capacidad personalizable; amplió la capacidad de modificación de anotaciones locales desde código y páginas web a documentos, hojas de cálculo y presentaciones de PowerPoint; y añadió la capacidad de generar sitios web para informes de resultados.

Al mismo tiempo, DouBao mencionó en su respuesta sobre las funciones de pago que, para satisfacer las necesidades de productividad de los profesionales, DouBao planea lanzar DouBao Professional, que incluirá servicios profesionales como desarrollo de software, análisis de datos, diseño profesional, automatización de procesos, análisis financiero e investigación científica.

Estas acciones de producto significan que el valor real de los escenarios de productividad, y no solo de los escenarios empresariales tradicionales, ha sido verificado con dinero real.

Los datos publicados por OpenAI muestran que, desde febrero de este año, la actividad semanal de Codex aumentó seis veces, alcanzando los 5 millones, con un crecimiento entre profesionales conocedores tres veces mayor que el de los desarrolladores. Se espera que los ingresos de Anthropic en el segundo trimestre se multipliquen más del doble, hasta los 10.900 millones de dólares, y que puedan generar una utilidad operativa de 559 millones de dólares, con la mayoría de sus ingresos provenientes de empresas y startups.

La integración y conexión de productos internos se profundizan constantemente

La actualización y iteración del producto corresponde a una reestructuración más profunda de la arquitectura del producto. Por un lado, las grandes empresas actualmente han implementado chatbots y uno o varios productos de agentes, y ahora ya ha comenzado la integración de estos productos. El ejemplo más agresivo es la integración de OpenAI entre ChatGPT y Codex.

OpenAI desea elevar a ChatGPT de un simple punto de entrada de conversación a una interfaz principal para la colaboración con Agentes, mientras que Codex se transformará en una plataforma de Agentes universal capaz de satisfacer necesidades en múltiples escenarios, como oficina, investigación, procesos empresariales, análisis de datos y operaciones comerciales. Su núcleo se basa en la generalización de los casos de uso del Coding Agent. A través de esta integración, OpenAI espera extender Codex a la amplia base de usuarios de ChatGPT y aumentar su base de usuarios pagos.

También se informa que OpenAI planea integrar al navegador AI Atlas en esta fusión de aplicaciones de IA superiores.

Por otro lado, la integración consiste en que las capacidades y servicios de productos de internet de grandes empresas se están integrando rápidamente en productos de IA en forma de Skill o Agent. Que Alibaba añada a Qwen funciones como pedir comida a domicilio, llamar un taxi o comprar en Taobao fue una exploración temprana. Ahora, podemos ver que ByteDance, Meituan y Tencent también están realizando trabajos similares.

Después de integrar Douyin Mall con DouBao, ByteDance está aumentando las recomendaciones de tiendas y paquetes de ofertas para servicios locales de vida, como comida, entradas de cine y alojamientos. En la reunión de informes financieros, Meituan indicó que el asistente de IA "Xiao Tuan" se integró en la aplicación Meituan y sirvió a más de 100 millones de usuarios durante el Día Internacional del Trabajo, cubriendo escenarios como alimentación, entretenimiento, viajes y consultas médicas. Tencent Docs también convirtió las capacidades de procesamiento de documentos acumuladas en Skills, que son llamadas por WorkBuddy.

Tang Daosheng, vice president ejecutivo senior de Tencent Group, indicó durante la Conferencia sobre Aplicaciones Industriales de IA de Tencent Cloud 2026 que muchas funciones de aplicaciones tradicionales deben convertirse en capacidades que puedan ser invocadas por agentes inteligentes para liberar aún más el valor acumulado a lo largo de los años. Por ello, este año WeCom ha abierto algunas de sus capacidades de datos a través de interfaces y Skills, permitiendo que otros agentes inteligentes las utilicen. Esta tendencia hacia la apertura se vuelve cada vez más evidente.

La construcción del ecosistema de terceros comienza a figurar en la agenda

Una diferencia clave del agente respecto a productos anteriores es su capacidad para llamar herramientas. Esto requiere que el agente cuente detrás de un ecosistema de herramientas lo suficientemente rico. Incluso las grandes empresas tienen dificultades para construir este ecosistema por sí solas. Por ello, se necesita la construcción de ecosistemas de habilidades o agentes por parte de terceros.

La construcción de este ecosistema ya ha sido incluida en la agenda.

Después de completar la integración de los productos y servicios de primera parte de Alibaba, Qwen anunció que abrirá por completo a Agentes y Habilidades de terceros, permitiendo que todas las empresas operen sus propios Agentes de marca en Qwen. Esta semana, Luckin Coffee, KFC, Mixue Ice Cream & Tea y China Eastern Airlines ya han lanzado Habilidades en Qwen. Posteriormente, las empresas podrán personalizar la personalidad y los servicios específicos de sus Agentes en Qwen.

Tencent, por un lado, está integrando el servicio Xiao Mei de Meituan en Yuanbao para ofrecer a los usuarios servicios como pedidos de comida a domicilio y reparto; por otro lado, está acelerando la construcción del ecosistema de Agentes de WeChat.

Los medios de comunicación indican que el agente de WeChat ya completó las pruebas de prototipo y podría iniciar el proceso de aprobación regulatoria previo al lanzamiento público este mes. Este agente puede coordinar mini programas de WeChat para ofrecer servicios compuestos como pedir comida, llamar un taxi, reservar boletos, comprar y servicios locales.

Además, WeChat también está intentando establecer conexiones de agente a agente con fabricantes de teléfonos como Honor y Xiaomi, para permitir que los agentes de estos fabricantes utilicen sus capacidades básicas. Es decir, los fabricantes de teléfonos también se convertirán en nuevos puntos de entrada para el ecosistema de agentes de WeChat, creando una arquitectura en la que múltiples puntos de entrada comparten un mismo ecosistema de agentes.

Los plugins de Agent de OpenAI pueden empaquetar de forma integral las herramientas, conocimientos y habilidades requeridos para un puesto. Por ejemplo, el plugin de producción creativa puede generar un campaign board, variantes de anuncios display, imágenes de estilo de vida del producto y colecciones de imágenes para comercio electrónico, además de poder invocar herramientas como Figma, Canva, Shutterstock, Picsart y Fal. En términos simples, se trata de un sistema de transmisión profesional preparado para Agent.

Actualmente, los complementos de Agent de Codex cubren 62 aplicaciones populares y 110 habilidades. En el futuro, OpenAI espera abrir el ecosistema de complementos a socios, permitiendo que terceros creen y desplieguen sus propios complementos directamente en Codex y ChatGPT.

El contexto se vuelve aún más importante

Yao Shunyu indicó que los modelos se vuelven cada vez más hábiles para convertir entradas complejas en salidas, pero con la condición de que puedan obtener entradas lo suficientemente buenas. Esto requiere que, en el lado del usuario, se proporcione al modelo y al agente información suficientemente detallada y útil, para que el modelo y el agente puedan comprender preguntas que anclen el camino correcto, como «¿Quién eres?», «¿Qué estás haciendo?» y «¿Qué respuesta te resulta valiosa?».

En el desarrollo, también es necesario un diálogo contextual adecuado en torno al desarrollo de productos de IA. Yao Shunyu y Tang Daosheng mencionaron en el diálogo anterior que el desarrollo de productos de IA debe basarse en la retroalimentación del producto para determinar qué debe recompensar el modelo, qué debe penalizar, qué respuestas se consideran buenas y qué comportamientos se consideran malos. Esto implica que los equipos de modelo y producto deben completar un Co-Design mediante un proceso de compartir contexto, creando juntos una mejor experiencia.

Por lo tanto, los productos de IA deben conectarse y acumular información contextual de múltiples fuentes en el lado del usuario, y alinearse con la intención de la tarea del agente determinando qué información proporcionar y qué información omitir; en el lado del desarrollo, es necesario establecer un mecanismo de retroalimentación fluido para alinear los objetivos de desarrollo del equipo de modelos con los del equipo de producto, acelerando así la optimización de la experiencia.

Tanto la acumulación de contexto desde el lado del usuario como el intercambio de contexto desde el lado del desarrollo no son solo problemas técnicos, sino también organizacionales, y deben lograrse mediante la colaboración.

Por eso, OpenAI comenzó a reorganizar su equipo en enero de este año para fomentar una colaboración más estrecha entre el equipo de productos y los investigadores responsables de los modelos subyacentes relacionados; posteriormente, integró los equipos de ChatGPT, Codex y API en un solo departamento bajo la responsabilidad de Thibault Sottiaux.

Al mismo tiempo, la importancia dada al contexto podría estimular la agentización del hardware, convirtiendo al hardware en un medio efectivo para que los agentes recojan el contexto del usuario. El proyecto Solara de Microsoft está explorando precisamente esto. La comunicación en cualquier momento y lugar no es el único objetivo del desarrollo de terminales de escritorio y dispositivos portátiles para agentes; el propósito principal es proporcionar más información contextual para que los agentes ejecuten tareas en escenarios de escritorio y móviles.

En los últimos años, la industria de la IA ha seguido una ruta técnica relativamente clara: preentrenamiento → postentrenamiento → Agentes → Agentes de codificación. Esta ruta puede no ser la única línea principal del futuro, pero es la más efectiva que las grandes empresas pueden aprovechar en la actualidad.

Las cuatro tendencias que hemos identificado son coordenadas básicas interconectadas en rutas fijas, cuyo objetivo final es lograr que el Coding Agent se generalice en escenarios universales. Se trata nuevamente de una competencia a nivel de sistema.

La competencia del agente de Big Tech evoluciona en cuatro direcciones clave

Los "colegas" se convierten en el punto focal de la competencia de los Agentes

La integración y conexión de productos internos se profundizan constantemente

La construcción del ecosistema de terceros comienza a figurar en la agenda

El contexto se vuelve aún más importante