L'IA de WeChat a enfin bougé.
Le même jour que la WWDC d'Apple, WeChat a accompli une action potentiellement plus importante qu'Apple : il a publié une annonce simple et directe intitulée « Guide pour l'intégration des développeurs à l'écosystème IA de WeChat ».

À compter d'aujourd'hui, les développeurs de mini-programmes peuvent accorder une autorisation permettant à l'IA WeChat d'effectuer la lecture, l'opération et l'appel des fonctionnalités des mini-programmes.
WeChat propose deux méthodes d'intégration : la « mode automatique », dont le seuil d'entrée est presque nul ; les développeurs n'ont qu'à activer un commutateur, la plateforme lit automatiquement le code source, analyse la page et comprend les fonctionnalités de l'application mini, permettant ainsi à l'IA de commencer à l'utiliser directement, sans écrire une seule ligne de code.
Un autre mode appelé « mode développement » permet aux développeurs de créer des compétences personnalisées qui, une fois approuvées, peuvent être appelées par l’IA. Les deux modes peuvent être activés simultanément. Meituan a déjà annoncé son intégration.
Cela ne doit pas simplement être perçu comme le lancement d'une nouvelle fonctionnalité, mais comme le fait que WeChat transforme l'ensemble de son écosystème — des millions de mini-programmes, WeChat Pay, les notifications de service, les comptes officiels — en couche d'exécution pour l'IA.
Examinez la documentation Skill : comment l’IA WeChat appelle-t-elle les mini-programmes ?
La documentation ouverte de WeChat a publié les spécifications techniques pour l'intégration de compétences AI dans les mini-programmes ; en les examinant attentivement, on y découvre de nombreux détails de conception.
Documentation officielle des compétences 👇🏻 :
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

Sur le plan architecturale, les développeurs ayant travaillé sur l'IA reconnaîtront immédiatement qu'il s'agit fondamentalement du MCP. Le fichier mcp.json déclare les fonctionnalités et les paramètres de chaque interface atomique, tandis que SKILL.md décrit le déroulement complet du processus métier — une architecture identique à celle du MCP+Skills utilisée dans Claude, Cursor et VS Code. WeChat n'a pas réinventé la roue, mais a directement adopté la norme en cours de convergence dans l'industrie.
Dans le cadre de la directive, WeChat a établi un système clair de « pondération de l'attention ». Lorsqu'il décide d'appeler quelles interfaces ou quels paramètres générer, l'IA accorde la priorité absolue au contenu retourné par l'interface (cinq étoiles), puis à la description de l'interface et à la description des paramètres dans mcp.json (quatre étoiles chacune), et enfin au SKILL.md (trois étoiles). Cela signifie que l'emplacement où le développeur écrit un élément est plus important que le contenu lui-même — une même règle, lorsqu'elle est placée dans le retour d'interface ou dans le SKILL.md, reçoit une pondération totalement différente de la part de l'IA.

Au niveau de la réponse de l'interface, il existe une règle fondamentale : le format en deux parties « fait + action ». D'abord, indiquez à l'IA « ce qui s'est produit », puis « ce qu'elle doit faire ensuite ». Si vous ne mentionnez que l'action sans le fait, l'IA pourrait interpréter « afficher la carte » comme « préparer l'appel de l'interface suivante » et sauter la confirmation de l'utilisateur. C'est une règle qui n'a été découverte qu'après avoir rencontré de nombreux problèmes.

Quatrièmement, privilégiez le passage de paramètres par ID plutôt que par langage naturel. Reprenons l'exemple du « commande de café » illustré dans l'image : après que l'utilisateur a exprimé sa demande, l'IA comprend les intentions floues, gère les options, modifie les spécifications et traite le paiement, le tout sans quitter la fenêtre de conversation.
Ce design transmet le signal suivant : WeChat a déjà testé un grand nombre de cas en conditions réelles, connaît les pièges liés à l'appel d'services externes par l'IA, et a intégré ces expériences dans des normes pour les développeurs.
En réalité, si l'on compare les mini-programmes WeChat et les applications Apple, tous deux réputés pour leurs écosystèmes, WeChat dispose d'une « perspective divine » sur son propre écosystème, ce qui constitue la condition préalable à toute réalisation.
Comment peut-il être plus important que l'IA d'Apple ?
La nouvelle version de Siri AI publiée par Apple lors de la WWDC cette année, bien qu'elle intègre en arrière-plan Google Gemini et permette la création de raccourcis par langage naturel, n'a pas suscité beaucoup de discussions.

En observant de plus près, on remarque la différence : Apple se concentre sur l’intégration de l’IA pour coordonner certaines fonctions natives d’iOS, mais il peine dès qu’il s’agit d’applications tierces, celles que vous avez installées sur votre téléphone.
Par exemple, Ele.me exécute son code sur ses propres serveurs, que Apple ne peut pas lire. Pour que Siri puisse appeler Ele.me, les ingénieurs d’Ele.me doivent activement intégrer l’interface App Intents, en négociant et en connectant chaque cas individuellement, ce qui prend du temps et des efforts.

WeChat permet à l'IA d'interagir directement avec des millions de services tiers, car les mini-programmes sont différents. Le code de chaque mini-programme, depuis sa soumission par le développeur, en passant par la revue de WeChat, jusqu'à son exécution sur le téléphone de l'utilisateur, reste entièrement dans l'écosystème technologique de WeChat. Pendant la phase de revue, WeChat peut analyser automatiquement le code pour déterminer « quels sont les pages de ce mini-programme, quelles actions il peut effectuer, et quels sont ses entrées et sorties ».
C’est pourquoi le « mode automatique » est possible — les développeurs n’ont pas à écrire une seule ligne de code, ils n’ont qu’à activer un commutateur, et WeChat traduit automatiquement votre mini-programme en outil appelable par l’IA. L’infrastructure de base de WeChat est naturellement conçue pour cela ; elle possède une « vue de dieu » et peut orchestrer les opérations grâce à une centralisation.
Cet avantage architectural, Apple ne l'a pas, Google non plus.
Il est également à noter que, récemment, il a été rapporté que WeChat collabore avec Huawei, Honor, Xiaomi, OPPO et vivo pour introduire une fonctionnalité d'agent à agent (A2A), permettant aux utilisateurs de lancer directement des appels audio ou vidéo WeChat ou d'envoyer des messages via l'assistant vocal de leur téléphone.

Interneurement, l'IA WeChat peut accéder à des millions de mini-programmes ; externement, les assistants IA des fabricants de téléphones peuvent interagir avec WeChat. WeChat devient ainsi le super-connecteur de l'ère de l'IA, une plateforme centrale permettant à tous les systèmes d'IA de se connecter.
L'ancienne prédiction de « WeChat OS »
Lors du lancement du mini-programme, beaucoup ont plaisanté en disant que WeChat allait créer un « WeChat OS ». À l'époque, c'était davantage une métaphore — les mini-programmes remplaçaient une partie des fonctionnalités des applications, mais restaient fondamentalement une « plateforme d'applications légères ».
Plus par hasard, le mécanisme centralisé de révision conçu à l'époque visait à contrôler la qualité et la sécurité. Mais neuf ans plus tard, ce design autrefois critiqué comme « excessivement contrôlé » est devenu par hasard un avantage infrastructurel à l'ère de l'IA. L'écosystème d'applications distribué (Apple/Android), qui semblait alors plus « libre », est désormais devenu un obstacle à l'intégration de l'IA.

Une ancienne prophétie a été révolutionnée par l'apparition de nouvelles technologies de l'ère moderne — l'IA.
Lorsque j'ai écrit sur OpenClaw et Feishu, j'ai mentionné un jugement : l'IM est l'entrée la plus naturelle pour les AI Agents, car la conversation est elle-même la forme d'interaction la plus naturelle entre l'homme et l'IA, et l'écosystème de services intégré à l'IM (robots, paiements, mini-programmes) permet à l'IA non seulement de « discuter », mais aussi de « faire ». Feishu avance déjà dans cette direction, avec le déploiement d'API Bot améliorées et de nœuds AI Agent.

Cependant, Feishu est un outil de collaboration professionnelle axé sur les scénarios de bureau. WeChat, en revanche, possède une portée tout à fait différente : 1,432 milliard d'utilisateurs actifs mensuels, des centaines de mini-programmes dans des domaines spécialisés, allant de la commande de repas à la prise de rendez-vous médical, en passant par l'achat de billets d'avion et le paiement des factures d'électricité et d'eau, couvrant presque l'ensemble des besoins de services de la vie quotidienne.

Si l'IA WeChat peut véritablement appeler ces mini-programmes de manière fluide pour accomplir des tâches, alors, comme le prédit la prophétie, elle devient un système d'exploitation piloté par le langage naturel.
L'utilisateur dit : « Aidez-moi à réserver un train à grande vitesse de Pékin à Shanghai demain à 15 heures ». L'IA décompose l'intention, appelle le mini-programme 12306 pour vérifier les billets, sélectionner un siège et effectuer le paiement via WeChat pour finaliser la réservation, le tout sans quitter WeChat. Ce parcours est théoriquement réalisable dès aujourd'hui.
Bien sûr, il existe encore une distance entre la théorie et la réalité. Les appels AI impliquant des scénarios de paiement ont une tolérance aux erreurs quasi nulle — se tromper sur une tasse de café est mineur, mais réserver un billet d'avion erroné est grave. La précision requise du modèle sous-jacent dépasse largement celle des scénarios de conversation. C'est là le point de blocage commun au déploiement des AI Agent à l'échelle mondiale : entre « pouvoir discuter » et « pouvoir agir », ce n'est pas une métrique technique qui sépare les deux, mais la confiance.

Mais WeChat a au moins fait une chose correctement : il n’a pas construit son réseau de services à partir de zéro. Tout au long de ces années, ce que ChatGPT a fait, c’est commencer par avoir un cerveau intelligent, puis se connecter un par un à Shopify, DoorDash, Stripe, chaque connexion étant établie depuis zéro ; aujourd’hui, les requêtes liées aux transactions ne représentent toujours moins de 3 %.
Les véritables changements qui vont se produire seront, pour la plupart des utilisateurs, presque imperceptibles. Un jour, vous taperez dans WeChat : « Réserve-moi un billet pour Shanghai à 21 heures ce soir », et il sera réservé, sans que vous sachiez quel mini-programme a été utilisé ni quel processus de paiement a été effectué.
Cette « réalisation imperceptible » est le véritable signe de la maturité des agents IA, et WeChat est plus proche de cette étape que quiconque.
Cet article provient du compte officiel WeChat « APPSO », auteur : APPSO, qui découvre les produits de demain.
