ИИ в WeChat наконец-то двинулся.
В тот же день, что и WWDC от Apple, WeChat совершил дело, возможно, более важное, чем у Apple: опубликовал скромное объявление «Руководство по интеграции разработчиков в экосистему ИИ WeChat».

Сегодня разработчики мини-программ могут предоставить разрешение на чтение, управление и вызов функций мини-программы через ИИ WeChat.
WeChat предлагает два способа интеграции: первый — «автоматический режим», порог входа практически нулевой: разработчик включает переключатель, платформа самостоятельно считывает исходный код, анализирует страницу и понимает, что может делать мини-программа, после чего ИИ сразу начинает выполнять действия — ни одной строки кода писать не нужно.
Другой называется «режим разработчика»: разработчики самостоятельно создают настраиваемые навыки, которые после прохождения проверки могут вызываться ИИ. Оба режима можно включить одновременно. Meituan уже объявила о подключении.
Это нельзя просто воспринимать как еще одну новую функцию — важно понимать, что WeChat превращает всю свою экосистему — миллионы мини-программ, WeChat Pay, сервисные уведомления, официальные аккаунты — в исполнительный уровень для ИИ.
Изучите документацию Skill: как微信 AI вызывает мини-программы?
В открытой документации WeChat были опубликованы технические спецификации интеграции навыков ИИ в мини-программы; при внимательном изучении в них скрыто множество деталей дизайна.
Официальная документация по навыкам: 👇🏻
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

С точки зрения архитектуры, разработчики, имеющие опыт в области ИИ, сразу узнают, что по сути это MCP. Файл mcp.json описывает функциональность и параметры каждого атомарного интерфейса, а файл SKILL.md объясняет, как выполняется весь бизнес-процесс — это почти идентично архитектуре MCP+Skills в Claude, Cursor и VS Code. WeChat не создавал ничего нового, а сразу использовал стандарт, который сейчас активно внедряется в отрасли.
В руководстве WhatsApp представлена четкая система «весов внимания». При решении, какой API вызвать и какие параметры сгенерировать, AI в первую очередь учитывает content, возвращаемый API (пять звезд), затем описание API и описание параметров в файле mcp.json (по четыре звезды), а SKILL.md занимает последнее место (три звезды). Это означает, что для разработчика важно не только, что написано, но и где — одна и та же инструкция, помещенная в возвращаемый API content или в SKILL.md, получит совершенно разный вес от AI.

На уровне возврата интерфейса существует одна основная норма: двухчастная структура «факт + действие». Сначала сообщите ИИ, «что произошло», а затем — «что делать дальше». Если указывать только действие, не упоминая факт, ИИ может интерпретировать «отобразить карточку» как «подготовиться к вызову следующего интерфейса» и пропустить подтверждение пользователя. Это правило выработано после множества ошибок.

В-четвертых, при передаче параметров используйте идентификаторы, а не естественный язык. На примере сценария «заказ кофе» на изображении: после того как пользователь формулирует запрос, ИИ понимает нечеткие намерения, выбирает варианты, изменяет параметры и обрабатывает оплату — все это происходит без выхода за пределы диалогового окна.
Этот дизайн сигнализирует о том, что WeChat уже прошел достаточное количество реальных случаев и знает, в чем заключаются подводные камни при вызове ИИ внешних сервисов, а также закрепил этот опыт в виде стандартов для разработчиков.
На самом деле, если сравнить вичат-мини-программы и приложения Apple, которые также известны своим «экосистемным» подходом, WeChat обладает «божественной перспективой» по отношению к своей собственной экосистеме — это предпосылка для всего реализуемого.
Как это может быть важнее, чем Apple AI
Новая версия Siri AI, выпущенная Apple на WWDC этого года, несмотря на то, что в ее основе используется Google Gemini, а Shortcuts поддерживают создание с помощью естественного языка, не вызвала много обсуждений.

При более внимательном рассмотрении становится очевидным различие: Apple создает решение, позволяющее ИИ координировать некоторые встроенные функции в операционной системе iOS, но как только речь заходит о сторонних приложениях — тех, что установлены на вашем телефоне, — она оказывается не в состоянии справиться.
Например, Ele.me: его код работает на собственных серверах Ele.me, и Apple не может его прочитать. Чтобы Siri могла взаимодействовать с Ele.me, инженеры Ele.me должны самостоятельно подключиться к интерфейсам App Intents — по одному договору за раз, что занимает много времени и усилий.

А WeChat позволяет ИИ напрямую управлять миллионами сторонних сервисов, потому что мини-программы отличаются. Код каждой мини-программы — от отправки разработчиком, через проверку WeChat, до запуска на телефоне пользователя — полностью находится в технической системе WeChat. На этапе проверки WeChat может просканировать код и автоматически проанализировать: «Какие страницы есть в этой мини-программе, какие функции она выполняет и какие у нее входные и выходные данные».
Таким образом, «автоматический режим» может работать — разработчику не нужно писать ни одной строки кода, достаточно включить переключатель, и WeChat самостоятельно переведет ваше мини-приложение в инструмент, доступный для вызова ИИ. Базовая архитектура WeChat изначально поддерживает это, поскольку она обладает «божественным взглядом» и может осуществлять управление на основе централизованной системы.
Это преимущество архитектуры есть у нас, но нет у Apple и у Google.
Также стоит отметить, что недавно появилась информация о том, что WeChat сотрудничает с Huawei, Honor, Xiaomi, OPPO и vivo над реализацией возможностей A2A (Agent-to-Agent), позволяющих пользователям инициировать аудио- и видеозвонки в WeChat или отправлять сообщения напрямую через голосового помощника на своих телефонах.

Внутри微信 AI может использовать миллионы мини-программ; снаружи AI-ассистенты производителей смартфонов могут взаимодействовать с WeChat. WeChat становится супер-коннектором эпохи ИИ — центром сервисов, к которому могут подключаться все ИИ.
Старое предсказание «WeChat OS»
При запуске мини-программ многие шутили, что WeChat собирается создать «WeChat OS». Тогда это было скорее метафорой — мини-программы заменяли часть функций приложений, но по сути оставались «платформой легких приложений».
Более случайно то, что централизованный механизм проверки, разработанный тогда, был направлен на контроль качества и безопасности. Но через девять лет этот дизайн, который тогда критиковали как «чрезмерный контроль», неожиданно стал преимуществом в инфраструктуре эпохи ИИ. Распределённая экосистема приложений (Apple/Android) тогда казалась более «свободной», а теперь стала препятствием для интеграции ИИ.

Старое предсказание кардинально изменилось благодаря появлению новых технологий эпохи — ИИ.
Ранее, когда я писал об OpenClaw и Feishu, я упоминал следующее суждение: IM является самым естественным входом для AI-агентов, поскольку диалог — это наиболее естественный способ взаимодействия человека с ИИ, а экосистема сервисов IM (роботы, платежи, мини-программы) позволяет ИИ не только «общаться», но и «действовать». Feishu уже движется в этом направлении, запустив улучшенный Bot API и узлы AI-агентов.

Однако Feishu — это инструмент корпоративного взаимодействия, ориентированный на рабочие сценарии. WeChat имеет совершенно иной масштаб — 1,432 миллиарда активных пользователей в месяц, сотни микропрограмм в различных нишах, от заказа еды и записи на прием к врачу до покупки авиабилетов и оплаты коммунальных услуг, охватывая практически все потребности в услугах повседневной жизни человека.

Если вичат ИИ действительно сможет плавно вызывать эти мини-программы для выполнения задач, то, как и предсказывалось, он превратится в операционную систему, управляемую естественным языком.
Пользователь говорит: «Забронируйте мне высокоскоростной поезд из Пекина в Шанхай завтра в 15:00». ИИ анализирует намерение, вызывает мини-программу 12306 для поиска билетов, выбора места и завершает заказ через WeChat Pay — всё внутри WeChat. Эта цепочка теоретически может быть реализована уже сегодня.
Конечно, между теорией и практикой существует расстояние. Вызовы ИИ, связанные с платежными сценариями, имеют уровень допустимой ошибки, близкий к нулю: ошибиться с чашкой кофе — мелочь, а ошибиться с билетом на самолет — серьезная проблема. Требования к точности базовой модели значительно выше, чем в диалоговых сценариях. Это общее ограничение, с которым сталкиваются все мировые AI-агенты: между «умением общаться» и «умением выполнять задачи» стоит не технический показатель, а доверие.

Но Вичат по крайней мере сделал одно правильное дело: он не строил сеть сервисов с нуля. Все эти годы ChatGPT делал то, что сначала имел умный мозг, а затем по одному подключал Shopify, DoorDash, Stripe — каждое подключение создавалось с нуля, и сегодня на транзакционные запросы приходится менее 3%.
Настоящие изменения, которые произойдут, для большинства пользователей могут пройти незаметно. Однажды вы набираете в WeChat: «Забронируй мне билет в Шанхай на девять часов вечера», и он автоматически бронируется — вы даже не знаете, какая мини-программа была задействована и какой процесс оплаты был использован.
Такая «невоспринимаемая завершённость» — настоящий признак зрелости AI-агента, и WeChat ближе к этому шагу, чем кто-либо другой.
Эта статья с веб-сайта WeChat «APPSO», автор: APPSO — обнаружение продуктов завтрашнего дня
