微信推出 AI 驅動的小程式生態，AI 整合超越蘋果

WeChat's AI has finally moved.

就在蘋果 WWDC 的同一天，微信做了一件可能比蘋果更重要的事，發布了一份樸實無華的公告：《關於開發者接入微信 AI 生態的指引》。

從今天起，小程序開發者可以授予授權，讓微信 AI 讀取、操作和調用小程序的功能。

微信提供了兩種接入方式：一種是「自動模式」，門檻幾乎為零，開發者只需打開一個開關，平台會自行讀取原始碼、分析頁面、理解小程序的功能，然後 AI 就能直接上手操作，無需編寫任何代碼。

另一種稱為「開發模式」，開發者可自行開發客製化的 Skill，通過審核後由 AI 調用。兩種模式可同時啟用。美團已宣布接入。

這不能僅僅被理解為又一個新功能上線，而是要看到，微信正將其整個生態系統——數百萬個小程序、微信支付、服務通知、公眾號——轉變為 AI 的執行層。

扒一扒 Skill 文檔，微信 AI 是怎麼調小程序的

微信開放文檔中公開了小程式接入 AI 的 Skill 技術規範，仔細查看，其中隱藏了許多設計細節。

官方 skill 文件指引👇🏻：

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

從架構上看，有 AI 開發經驗的人會立刻認出，本質上就是 MCP。mcp.json 声明每個原子接口的功能和參數，SKILL.md 描述整個業務流程如何運行，這與 Claude、Cursor、VS Code 中的 MCP+Skills 架構幾乎完全相同。微信沒有另起爐灶，直接採用了業界正在收斂的標準。

在指導方案中，微信提供了一套清晰的「注意力權重」體系。AI 在決定調用哪個接口、生成什麼參數時，最優先查看的是接口返回的 content（五星），其次是 mcp.json 中的接口 description（四星）和參數 description（四星），SKILL.md 則排在最後（三星）。這意味著開發者將規則寫在哪裡，比寫了什麼更重要——同樣的一條規則，寫在接口返回中和寫在 SKILL.md 中，AI 給予的權重完全不同。

在接口返回層面，有一條核心規範：「事實＋動作」兩段式。先告訴 AI「發生了什麼」，再告訴它「下一步做什麼」。如果只寫動作而不寫事實，AI 可能會將「顯示卡片」理解為「準備調用下一個接口」而跳過用戶確認。這是一條經過多次踩坑後才總結出來的規則。

第四，參數傳遞應優先使用 ID 而非自然語言。以圖中的「咖啡點單」場景為例，用戶提出需求後，AI 會理解模糊意圖、選擇項、修改規格及處理支付，全程無需跳出對話框。

這套設計傳遞的訊號是：微信已在實際應用中驗證了足夠多的案例，深知 AI 調用外部服務的陷阱所在，並將這些經驗固化為開發者規範。

實際上，若將同樣以「生態」著稱的微信小程序和蘋果應用進行對比，微信對其自身生態擁有「上帝視角」，這是一切實現的前提。

什麼比蘋果 AI 還重要

今年蘋果在 WWDC 上發布的新版 Siri AI，儘管底層接入了 Google Gemini，Shortcuts 支援自然語言建立，卻沒有引起太多討論。

仔細觀察就會發現差距：蘋果所做的，是讓 AI 在 iOS 系統內協調一些原生功能，但一旦涉及第三方應用、那些安裝在您手機上的 App，它就會捉襟見肘。

例如餓了麼，它的代碼運行在餓了麼自己的伺服器上，蘋果無法讀取。Siri 要調用餓了麼，必須由餓了麼的工程師主動對接 App Intents 這套介面，逐一談判、逐一接入，中間耗時耗力。

而微信的優勢在於讓 AI 直接操作數百萬個第三方服務，因為小程序並不相同。每一個小程序的代碼，從開發者提交、微信審核，到最終在用戶手機上運行，全程都在微信的技術體系內。微信在審核階段就能掃描代碼，自動分析「這個小程序有哪些頁面、能做什麼事、輸入輸出是什麼」。

因此，「自動模式」才能成立——開發者無需撰寫任何代碼，打開開關，微信就能自行將您的小程序翻譯成 AI 可調用的工具。微信的基礎架構天然支持此做法，它擁有「上帝視角」，能夠基於中心化實現調度。

This architecture advantage is something Apple doesn’t have, and neither does Google.

同樣值得注意的是，不久前傳出微信正與華為、榮耀、小米、OPPO、vivo 合作推出 A2A（Agent-to-Agent）助手功能，用戶可透過手機語音助理直接發起微信音視頻通話或發送訊息。

對內，微信 AI 可調用數百萬個小程式；對外，手機廠商的 AI 助理可調用微信。微信正成為 AI 時代的超級連接器，讓所有 AI 都能接入的服務中樞。

「微信 OS」的舊預言

當小程序推出時，很多人戲稱微信要打造「微信 OS」。當時這更像是一種修辭——小程序取代了部分 App 的功能，但本質上仍是一個「輕應用平台」。

更偶然的是，當時設計的中心化審核機制，是出於控制品質與安全。但九年後，這個當初被批評為「管控過度」的設計，意外地成了 AI 時代的基礎設施優勢。分佈式的 App 生態（蘋果／Android）當時看起來更「自由」，現在反而成了 AI 接入的障礙。

一個舊的預言，由於新時代的技術——AI——的出現，有了顛覆性的變化。

之前在撰寫 OpenClaw 和飛書時，我曾提出一個判斷：IM 是 AI Agent 最天然的入口，因為對話本身就是人與 AI 最自然的互動方式，而 IM 自帶的服務生態（機器人、支付、小程序）讓 AI 不只能「聊」，還能「做」。飛書已朝這個方向推進，上線了 Bot API 增強和 AI Agent 節點。

但飛書是企業協作工具，覆蓋的是辦公場景。微信則擁有完全不同的廣度——14.32 億月活躍用戶，數百個細分領域的小程序，從點外賣、掛號、買機票到繳水電費，幾乎覆蓋了個人日常生活的所有服務需求。

如果微信 AI 真的能流暢地調用這些小程式完成任務，那麼正如預言所說，它成為了一個用自然語言操作的操作系統。

用戶說一句「幫我訂明天下午三點從北京到上海的高鐵」，AI 拆解意圖，調用 12306 小程序查票、選座、微信支付完成下單，全程不出微信。這條鏈路理論上今天就可以跑通。

當然，理論與現實之間仍有差距。AI 調用涉及支付場景的服務，容錯率接近零——點錯一杯咖啡是小事，買錯一張機票就是大事。底層模型的準確性要求遠高於對話場景。這也是全球 AI Agent 落地面臨的共同瓶頸：從「能聊天」到「能辦事」，中間隔的不是技術指標，是信任。

但微信至少做對了一件事：它沒有從零搭建服務網絡。這些年來，ChatGPT 所做的事是先有一個聰明的腦子，再一個一個去連接 Shopify、DoorDash、Stripe，每一個都是從零建立的連接，到今天與交易相關的查詢占比還不到 3%。

真正將要發生的變化，對大多數用戶來說，可能是悄無聲息的。某一天你在微信裡敲打一句「幫我訂今晚九點去上海的票」，然後它就訂好了，你甚至不知道背後調了哪個小程序，走了什麼支付流程。

這種「無感知的完成」，才是 AI Agent 真正成熟的標誌，微信離這一步，比任何人都近。

本文來自微信公眾號「APPSO」，作者：發現明日產品的 APPSO