WeChat's AI has finally moved.
就在蘋果 WWDC 的同一天,微信做了一件可能比蘋果更重要的事,發布了一份樸實無華的公告:《關於開發者接入微信 AI 生態的指引》。

從今天起,小程序開發者可以授予授權,讓微信 AI 讀取、操作和調用小程序的功能。
微信提供了兩種接入方式:一種是「自動模式」,門檻幾乎為零,開發者只需打開一個開關,平台會自行讀取原始碼、分析頁面、理解小程序的功能,然後 AI 就能直接上手操作,無需編寫任何代碼。
另一種稱為「開發模式」,開發者可自行開發客製化的 Skill,通過審核後由 AI 調用。兩種模式可同時啟用。美團已宣布接入。
這不能僅僅被理解為又一個新功能上線,而是要看到,微信正將其整個生態系統——數百萬個小程序、微信支付、服務通知、公眾號——轉變為 AI 的執行層。
扒一扒 Skill 文檔,微信 AI 是怎麼調小程序的
微信開放文檔中公開了小程式接入 AI 的 Skill 技術規範,仔細查看,其中隱藏了許多設計細節。
官方 skill 文件指引👇🏻:
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

從架構上看,有 AI 開發經驗的人會立刻認出,本質上就是 MCP。mcp.json 声明每個原子接口的功能和參數,SKILL.md 描述整個業務流程如何運行,這與 Claude、Cursor、VS Code 中的 MCP+Skills 架構幾乎完全相同。微信沒有另起爐灶,直接採用了業界正在收斂的標準。
在指導方案中,微信提供了一套清晰的「注意力權重」體系。AI 在決定調用哪個接口、生成什麼參數時,最優先查看的是接口返回的 content(五星),其次是 mcp.json 中的接口 description(四星)和參數 description(四星),SKILL.md 則排在最後(三星)。這意味著開發者將規則寫在哪裡,比寫了什麼更重要——同樣的一條規則,寫在接口返回中和寫在 SKILL.md 中,AI 給予的權重完全不同。

在接口返回層面,有一條核心規範:「事實+動作」兩段式。先告訴 AI「發生了什麼」,再告訴它「下一步做什麼」。如果只寫動作而不寫事實,AI 可能會將「顯示卡片」理解為「準備調用下一個接口」而跳過用戶確認。這是一條經過多次踩坑後才總結出來的規則。

第四,參數傳遞應優先使用 ID 而非自然語言。以圖中的「咖啡點單」場景為例,用戶提出需求後,AI 會理解模糊意圖、選擇項、修改規格及處理支付,全程無需跳出對話框。
這套設計傳遞的訊號是:微信已在實際應用中驗證了足夠多的案例,深知 AI 調用外部服務的陷阱所在,並將這些經驗固化為開發者規範。
實際上,若將同樣以「生態」著稱的微信小程序和蘋果應用進行對比,微信對其自身生態擁有「上帝視角」,這是一切實現的前提。
什麼比蘋果 AI 還重要
今年蘋果在 WWDC 上發布的新版 Siri AI,儘管底層接入了 Google Gemini,Shortcuts 支援自然語言建立,卻沒有引起太多討論。

仔細觀察就會發現差距:蘋果所做的,是讓 AI 在 iOS 系統內協調一些原生功能,但一旦涉及第三方應用、那些安裝在您手機上的 App,它就會捉襟見肘。
例如餓了麼,它的代碼運行在餓了麼自己的伺服器上,蘋果無法讀取。Siri 要調用餓了麼,必須由餓了麼的工程師主動對接 App Intents 這套介面,逐一談判、逐一接入,中間耗時耗力。

而微信的優勢在於讓 AI 直接操作數百萬個第三方服務,因為小程序並不相同。每一個小程序的代碼,從開發者提交、微信審核,到最終在用戶手機上運行,全程都在微信的技術體系內。微信在審核階段就能掃描代碼,自動分析「這個小程序有哪些頁面、能做什麼事、輸入輸出是什麼」。
因此,「自動模式」才能成立——開發者無需撰寫任何代碼,打開開關,微信就能自行將您的小程序翻譯成 AI 可調用的工具。微信的基礎架構天然支持此做法,它擁有「上帝視角」,能夠基於中心化實現調度。
This architecture advantage is something Apple doesn’t have, and neither does Google.
同樣值得注意的是,不久前傳出微信正與華為、榮耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手功能,用戶可透過手機語音助理直接發起微信音視頻通話或發送訊息。

對內,微信 AI 可調用數百萬個小程式;對外,手機廠商的 AI 助理可調用微信。微信正成為 AI 時代的超級連接器,讓所有 AI 都能接入的服務中樞。
「微信 OS」的舊預言
當小程序推出時,很多人戲稱微信要打造「微信 OS」。當時這更像是一種修辭——小程序取代了部分 App 的功能,但本質上仍是一個「輕應用平台」。
更偶然的是,當時設計的中心化審核機制,是出於控制品質與安全。但九年後,這個當初被批評為「管控過度」的設計,意外地成了 AI 時代的基礎設施優勢。分佈式的 App 生態(蘋果/Android)當時看起來更「自由」,現在反而成了 AI 接入的障礙。

一個舊的預言,由於新時代的技術——AI——的出現,有了顛覆性的變化。
之前在撰寫 OpenClaw 和飛書時,我曾提出一個判斷:IM 是 AI Agent 最天然的入口,因為對話本身就是人與 AI 最自然的互動方式,而 IM 自帶的服務生態(機器人、支付、小程序)讓 AI 不只能「聊」,還能「做」。飛書已朝這個方向推進,上線了 Bot API 增強和 AI Agent 節點。

但飛書是企業協作工具,覆蓋的是辦公場景。微信則擁有完全不同的廣度——14.32 億月活躍用戶,數百個細分領域的小程序,從點外賣、掛號、買機票到繳水電費,幾乎覆蓋了個人日常生活的所有服務需求。

如果微信 AI 真的能流暢地調用這些小程式完成任務,那麼正如預言所說,它成為了一個用自然語言操作的操作系統。
用戶說一句「幫我訂明天下午三點從北京到上海的高鐵」,AI 拆解意圖,調用 12306 小程序查票、選座、微信支付完成下單,全程不出微信。這條鏈路理論上今天就可以跑通。
當然,理論與現實之間仍有差距。AI 調用涉及支付場景的服務,容錯率接近零——點錯一杯咖啡是小事,買錯一張機票就是大事。底層模型的準確性要求遠高於對話場景。這也是全球 AI Agent 落地面臨的共同瓶頸:從「能聊天」到「能辦事」,中間隔的不是技術指標,是信任。

但微信至少做對了一件事:它沒有從零搭建服務網絡。這些年來,ChatGPT 所做的事是先有一個聰明的腦子,再一個一個去連接 Shopify、DoorDash、Stripe,每一個都是從零建立的連接,到今天與交易相關的查詢占比還不到 3%。
真正將要發生的變化,對大多數用戶來說,可能是悄無聲息的。某一天你在微信裡敲打一句「幫我訂今晚九點去上海的票」,然後它就訂好了,你甚至不知道背後調了哪個小程序,走了什麼支付流程。
這種「無感知的完成」,才是 AI Agent 真正成熟的標誌,微信離這一步,比任何人都近。
本文來自微信公眾號「APPSO」,作者:發現明日產品的 APPSO
