WeChat lanza un ecosistema de mini programas impulsado por IA, supera a Apple en integración de IA

La IA de WeChat finalmente se movió.

El mismo día de la WWDC de Apple, WeChat realizó un posible acto más importante que Apple: publicó un anuncio sencillo titulado «Guía para que los desarrolladores se integren al ecosistema de IA de WeChat».

WeChat

A partir de hoy, los desarrolladores de mini programas pueden otorgar autorización para que la IA de WeChat lea, opere y llame funciones del mini programa.

WeChat ofrece dos métodos de integración: uno es el "modo automático", con un umbral casi nulo; los desarrolladores solo necesitan activar un interruptor, la plataforma lee automáticamente el código fuente, analiza la página y comprende qué puede hacer la aplicación mini, luego la IA puede operar directamente sin escribir ninguna línea de código.

Otro se llama «modo de desarrollo», en el que los desarrolladores crean habilidades personalizadas que, tras aprobarse, son invocadas por la IA. Ambos pueden activarse simultáneamente. Meituan ya ha anunciado su integración.

Esto no debe interpretarse simplemente como la implementación de otra nueva función, sino como que WeChat está transformando todo su ecosistema — millones de mini programas, WeChat Pay, notificaciones de servicio, cuentas públicas — en la capa de ejecución de IA.

Revisar la documentación de Skill: ¿cómo llama el AI de WeChat a los miniprogramas?

Los documentos abiertos de WeChat publicaron las especificaciones técnicas para la integración de habilidades de IA en mini programas; al revisarlos detenidamente, se descubren muchos detalles de diseño.

Guía de la documentación oficial de skill👇🏻:

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

WeChat

Desde el punto de vista arquitectónico, los desarrolladores de IA lo reconocerán inmediatamente: es esencialmente MCP. El archivo mcp.json declara la función y los parámetros de cada interfaz atómica, y SKILL.md describe cómo se ejecuta todo el flujo de negocio, lo cual es casi idéntico a la arquitectura MCP+Skills de Claude, Cursor y VS Code. WeChat no creó un sistema nuevo, sino que adoptó directamente el estándar que la industria está consolidando.

En el esquema de guía, WeChat proporcionó un sistema claro de "pesos de atención". Cuando la IA decide qué interfaz llamar y qué parámetros generar, prioriza primero el contenido devuelto por la interfaz (cinco estrellas), seguido de la descripción de la interfaz y la descripción de los parámetros en mcp.json (cuatro estrellas cada una), y SKILL.md ocupa el último lugar (tres estrellas). Esto significa que para los desarrolladores, dónde escriben es más importante que qué escriben: la misma regla, si se incluye en la respuesta de la interfaz o en SKILL.md, recibe un peso completamente distinto por parte de la IA.

WeChat

En el nivel de respuesta de la interfaz, existe una norma fundamental: el formato de dos partes «hecho + acción». Primero, indique a la IA «qué sucedió», y luego, «qué hacer a continuación». Si solo se especifica la acción sin el hecho, la IA podría interpretar «mostrar la tarjeta» como «prepararse para llamar a la siguiente interfaz» y omitir la confirmación del usuario. Esta es una regla que solo se aprende tras haber enfrentado muchos errores.

WeChat

Cuarta, prioriza el uso de IDs en lugar de lenguaje natural para la transmisión de parámetros. Tomando como ejemplo el escenario de «pedido de café» en la imagen, después de que el usuario presente su solicitud, la IA entiende intenciones ambiguas, opciones, modificaciones de especificaciones y procesa el pago, todo sin salir del cuadro de diálogo.

La señal que transmite este diseño es que WeChat ya ha probado suficientes casos en la práctica, conoce los obstáculos en la llamada de IA a servicios externos y ha solidificado esta experiencia en normas para desarrolladores.

De hecho, si se compara con las aplicaciones de WeChat y Apple, que también son conocidas por su «ecosistema», WeChat tiene una «perspectiva de Dios» sobre su propio ecosistema, lo cual es la premisa para todo esto.

¿Cómo puede ser más importante que la IA de Apple?

La nueva versión de Siri AI que Apple lanzó en la WWDC este año, aunque subyace en Google Gemini y admite la creación de atajos mediante lenguaje natural, no generó mucha discusión.

WeChat

Al observar con detalle, se puede ver la diferencia: Apple está haciendo que la IA coordine algunas funciones nativas dentro del sistema iOS, pero cuando se trata de aplicaciones de terceros, esas apps instaladas en tu teléfono, se vuelve insuficiente.

Por ejemplo, Ele.me tiene su código ejecutándose en sus propios servidores, que Apple no puede leer. Para que Siri pueda acceder a Ele.me, los ingenieros de Ele.me deben activamente integrarse con la interfaz App Intents, negociando y conectando uno por uno, lo que consume mucho tiempo y esfuerzo.

WeChat

WeChat permite que la IA opere directamente millones de servicios de terceros, porque los programas mini son diferentes. El código de cada programa mini, desde su envío por parte del desarrollador, hasta la revisión de WeChat y finalmente su ejecución en el teléfono del usuario, ocurre completamente dentro del ecosistema técnico de WeChat. Durante la fase de revisión, WeChat puede escanear el código, analizar automáticamente «¿cuáles son las páginas de este programa mini, qué funciones puede realizar y cuáles son sus entradas y salidas?».

Por eso funciona el «modo automático»: los desarrolladores no necesitan escribir una sola línea de código, solo encienden un interruptor y WeChat traduce automáticamente tu mini programa en una herramienta que puede ser llamada por IA. La infraestructura básica de WeChat está diseñada naturalmente para hacer esto, ya que tiene una «visión de dios» y puede realizar el enrutamiento basado en una arquitectura centralizada.

Esta ventaja arquitectónica no la tiene Apple ni Google.

También es notable que recientemente se informó que WeChat está colaborando con Huawei, Honor, Xiaomi, OPPO y vivo para implementar capacidades de asistente A2A (Agent-to-Agent), permitiendo a los usuarios iniciar llamadas de audio o video de WeChat o enviar mensajes directamente a través del asistente de voz de sus teléfonos móviles.

WeChat

Internamente, la IA de WeChat puede acceder a millones de mini programas; externamente, los asistentes de IA de los fabricantes de teléfonos móviles pueden acceder a WeChat. WeChat se está convirtiendo en el superconector de la era de la IA, una central de servicios accesible para todas las IA.

La antigua profecía de «WeChat OS»

Cuando se lanzó el programa minúsculo, mucha gente bromeó diciendo que WeChat iba a crear un «WeChat OS». En ese momento, eso era más bien una metáfora: los programas minúsculos reemplazaban parte de las funciones de las aplicaciones, pero seguían siendo esencialmente una «plataforma de aplicaciones ligeras».

Más aún, el mecanismo de revisión centralizada diseñado en ese momento tenía como objetivo controlar la calidad y la seguridad. Pero nueve años después, este diseño, inicialmente criticado como «excesivamente regulado», se convirtió accidentalmente en una ventaja de infraestructura en la era de la IA. El ecosistema de aplicaciones distribuidas (Apple/Android) parecía más «libre» en ese momento, pero ahora se ha convertido en un obstáculo para el acceso a la IA.

WeChat

Una antigua profecía ha experimentado un cambio disruptivo debido a la aparición de la tecnología de la nueva era: la IA.

Cuando escribí sobre OpenClaw y Feishu, mencioné una evaluación: el IM es la entrada más natural para los AI Agent, ya que la conversación es la forma más natural de interacción entre humanos e IA, y el ecosistema de servicios integrado del IM (robots, pagos, mini programas) permite que la IA no solo pueda «charlar», sino también «hacer». Feishu ya está avanzando en esta dirección, lanzando mejoras en la API de Bot y nodos de AI Agent.

WeChat

Sin embargo, Feishu es una herramienta de colaboración empresarial que cubre escenarios laborales. WeChat tiene una amplitud completamente diferente: 1.432 mil millones de usuarios activos mensuales, cientos de programas mini en sectores especializados, desde pedir comida a domicilio hasta agendar citas médicas, comprar boletos de avión y pagar servicios públicos, cubriendo casi todas las necesidades de servicios de la vida diaria de una persona.

WeChat

Si la IA de WeChat realmente puede invocar sin problemas estos pequeños programas para completar tareas, entonces, como se predijo, se ha convertido en un sistema operativo operable mediante lenguaje natural.

El usuario dice: “Por favor, reserva un tren de alta velocidad de Beijing a Shanghái mañana a las 3 p.m.”, la IA descompone la intención, accede al小程序 de 12306 para consultar boletos, seleccionar asientos y completar el pedido mediante pago con WeChat, todo dentro de WeChat. Este flujo teóricamente puede ejecutarse hoy.

Por supuesto, aún existe una distancia entre la teoría y la realidad. Las llamadas de IA a servicios en escenarios de pago tienen una tolerancia al error casi nula: equivocarse al pedir una taza de café es algo menor, pero comprar un boleto de avión incorrecto es un gran problema. Los requisitos de precisión del modelo subyacente son mucho más altos que en escenarios de conversación. Este es el cuello de botella común que enfrenta la implementación global de agentes de IA: entre «poder chatear» y «poder realizar tareas», lo que separa no son métricas técnicas, sino confianza.

WeChat

Pero WeChat al menos hizo una cosa bien: no construyó la red de servicios desde cero. Durante todos estos años, lo que ha hecho ChatGPT es comenzar con un cerebro inteligente y luego conectar uno por uno con Shopify, DoorDash, Stripe, cada uno con una conexión construida desde cero; hasta hoy, las consultas relacionadas con transacciones aún representan menos del 3%.

Los cambios reales que ocurrirán probablemente serán silenciosos para la mayoría de los usuarios. Un día, escribes en WeChat: «Ayúdame a reservar un boleto para Shanghai a las 9 de esta noche», y se reserva automáticamente, sin que siquiera sepas qué aplicación mínima se utilizó ni qué proceso de pago se siguió.

Este tipo de "finalización imperceptible" es la verdadera señal de madurez de un agente de IA, y WeChat está más cerca de este paso que cualquier otra persona.

Este artículo proviene del canal de WeChat "APPSO", autor: APPSO, que descubre productos del mañana