WeChat Melancarkan Ekosistem Mini Program Berdayakan AI, Mengatasi Apple dalam Integrasi AI

AI WeChat akhirnya bergerak.

Pada hari yang sama dengan WWDC Apple, WeChat melakukan satu perkara yang mungkin lebih penting daripada Apple, iaitu mengeluarkan pengumuman sederhana: "Panduan untuk Pembangun untuk Mengintegrasikan Ekosistem AI WeChat".

WeChat

Mulai hari ini, pembangun miniprogram boleh memberikan kebenaran agar AI WeChat dapat membaca, mengendalikan, dan memanggil fungsi miniprogram.

WeChat menyediakan dua cara pengintegrasian: satu ialah "mod automatik", dengan ambang masuk hampir sifar, pembangun hanya perlu menghidupkan suis, platform akan membaca kod sumber, menganalisis laman web, memahami apa yang boleh dilakukan oleh aplikasi kecil, dan AI boleh terus mengendalikannya tanpa perlu menulis sebaris kod pun.

Satu lagi dipanggil "mod pembangun", di mana pembangun mengembangkan Skill yang disesuaikan sendiri dan ia akan dipanggil oleh AI setelah diluluskan. Kedua-duanya boleh diaktifkan serentak. Meituan telah mengumumkan pemasangan.

Ini bukan sekadar memahami sebagai pelancaran fungsi baru lagi, tetapi perlu dilihat bahawa WeChat sedang menjadikan seluruh ekosistemnya—jutaan program kecil, WeChat Pay, notifikasi perkhidmatan, akaun公众号—sebagai lapisan pelaksanaan AI.

Kaji dokumen Skill, bagaimana AI WeChat memanggil program kecil?

Dokumen terbuka WeChat telah mengumumkan spesifikasi teknis untuk integrasi AI Skill ke dalam program mini, dan jika diperhatikan dengan teliti, terdapat banyak butir reka bentuk tersembunyi di dalamnya.

Panduan dokumen kemahiran rasmi 👇🏻:

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

WeChat

Dari segi arsitektur, mereka yang pernah membangun AI akan segera mengenali bahawa pada dasarnya ia adalah MCP. mcp.json menyatakan fungsi dan parameter setiap antara atom, SKILL.md menggambarkan bagaimana keseluruhan proses perniagaan berjalan, yang hampir sama persis dengan arsitektur MCP+Skills di Claude, Cursor, dan VS Code. WeChat tidak memulakan semula, tetapi terus mengambil piawaian industri yang sedang berkonsolidasi.

Dalam panduan tersebut, WeChat menyediakan sistem "kepentingan perhatian" yang sangat jelas. Semasa AI menentukan antaramuka mana yang perlu dipanggil dan parameter apa yang perlu dihasilkan, ia memberi keutamaan tertinggi kepada content yang dikembalikan oleh antaramuka (bintang lima), diikuti oleh description antaramuka dan description parameter dalam mcp.json (bintang empat), dengan SKILL.md berada di posisi terakhir (bintang tiga). Ini bermakna di mana pembangun menulis sesuatu lebih penting daripada apa yang ditulis — peraturan yang sama, jika ditulis dalam content antaramuka berbanding dalam SKILL.md, akan mendapat kepentingan yang berbeza daripada AI.

WeChat

Pada peringkat pengembalian antaramuka, terdapat satu peraturan utama: struktur dua bahagian «fakta + tindakan». Pertama, beritahu AI «apa yang berlaku», kemudian beritahu ia «apa yang perlu dilakukan seterusnya». Jika hanya menulis tindakan tanpa fakta, AI mungkin memahami «tunjukkan kad» sebagai «sedia memanggil antaramuka seterusnya» dan melangkau pengesahan pengguna. Ini adalah peraturan yang hanya boleh dirumuskan selepas mengalami banyak kesilapan.

WeChat

Keempat, gunakan ID daripada bahasa semula jadi untuk penghantaran parameter. Dengan mengambil contoh adegan "pesanan kopi" dalam gambar, selepas pengguna mengemukakan permintaan, AI memahami niat yang kabur, pilihan, perubahan spesifikasi, dan pemprosesan pembayaran, semuanya tanpa meninggalkan kotak dialog.

Reka bentuk ini menunjukkan bahawa WeChat telah menguji cukup banyak kes dalam praktik, memahami perangkap dalam panggilan AI ke perkhidmatan luar, dan mengukuhkan pengalaman ini sebagai garis panduan pembangun.

Sebenarnya, jika dibandingkan dengan小程序 WeChat dan aplikasi Apple yang juga dikenal kerana「ekosistem」, WeChat memiliki「perspektif Tuhan」terhadap ekosistem sendiri, yang menjadi prasyarat semua pencapaian ini.

Bagaimana ia lebih penting daripada AI Apple

Siri AI versi baharu yang dilancarkan oleh Apple di WWDC tahun ini, walaupun menggunakan Google Gemini sebagai asas dan menyokong penciptaan Shortcuts melalui bahasa semula jadi, tidak menarik banyak perbincangan.

WeChat

Dengan memerhatikan lebih teliti, anda akan melihat perbezaannya: Apple membuat AI mengkoordinasikan beberapa fungsi asli dalam sistem iOS, tetapi apabila melibatkan aplikasi pihak ketiga, aplikasi yang dipasang di telefon anda, ia menjadi tidak mencukupi.

Sebagai contoh, Ele.me, kodnya berjalan di pelayan sendiri Ele.me, yang tidak boleh dibaca oleh Apple. Untuk Siri memanggil Ele.me, jurutera Ele.me perlu secara aktif mengintegrasikan antaramuka App Intents, berunding dan menghubungkan satu per satu, yang memakan masa dan usaha.

WeChat

WeChat membolehkan AI mengendalikan jutaan perkhidmatan pihak ketiga secara langsung, kerana aplikasi kecil berbeza. Setiap kod aplikasi kecil, dari penghantaran pengembang, melalui pemeriksaan WeChat, hingga berjalan di telefon pengguna, semuanya berada dalam sistem teknologi WeChat. WeChat boleh memindai kod semasa peringkat pemeriksaan, menganalisis secara automatik «apakah halaman-halaman aplikasi kecil ini, apa yang boleh dilakukan, dan apakah input dan outputnya».

Oleh itu, "modus automatik" baru boleh berfungsi—pengembang tidak perlu menulis sebaris kod pun, cukup nyalakan suis, dan WeChat sendiri akan menerjemahkan aplikasi kecil anda menjadi alat yang boleh dipanggil oleh AI. Infrastruktur asas WeChat secara semula jadi menyokong cara ini, kerana ia memiliki "sudut pandang Tuhan" dan mampu mengendalikan pengagihan berdasarkan pusat.

Kelebihan struktur ini, Apple tidak memilikinya, Google juga tidak.

Perlu juga diperhatikan bahawa baru-baru ini dilaporkan bahawa WeChat sedang bekerjasama dengan Huawei, Honor, Xiaomi, OPPO, dan vivo untuk memperkenalkan kemampuan A2A (Agent-to-Agent), di mana pengguna boleh memulakan panggilan video atau suara WeChat atau menghantar mesej secara langsung melalui pembantu suara telefon bimbit mereka.

WeChat

Secara dalaman, AI WeChat boleh mengakses jutaan program kecil; secara luaran, pembantu AI daripada pengeluar telefon bimbit boleh mengakses WeChat. WeChat sedang menjadi penghubung super di era AI, menjadi pusat perkhidmatan yang boleh diakses oleh semua AI.

Ramalan lama "WeChat OS"

Semasa aplikasi kecil dilancarkan, ramai orang bercanda bahawa WeChat sedang membuat "WeChat OS". Pada masa itu, ini lebih seperti satu retorik—aplikasi kecil menggantikan sebahagian fungsi aplikasi, tetapi pada dasarnya masih merupakan "platform aplikasi ringan".

Lebih tidak disangka lagi, mekanisme pengesahan terpusat yang direka pada masa itu bertujuan untuk mengawal kualiti dan keselamatan. Tetapi sembilan tahun kemudian, rekaan yang pada mulanya dikritik sebagai "pengawasan berlebihan" ini secara tidak disangka menjadi kelebihan infrastruktur di era AI. Ekosistem App teragih (Apple/Android) pada masa itu kelihatan lebih "bebas", tetapi kini malah menjadi halangan kepada akses AI.

WeChat

Sebuah ramalan lama telah mengalami perubahan revolusioner akibat munculnya teknologi zaman baru—AI.

Semasa menulis mengenai OpenClaw dan Feishu sebelum ini, saya pernah menyatakan satu penilaian: IM merupakan pintu masuk paling semula jadi untuk AI Agent, kerana perbualan itu sendiri adalah cara interaksi paling semula jadi antara manusia dan AI, dan ekosistem perkhidmatan IM yang sedia ada (robot, pembayaran, aplikasi kecil) membolehkan AI tidak hanya mampu ‘berbual’ tetapi juga ‘melakukan’. Feishu sudah bergerak ke arah ini dengan melancarkan peningkatan Bot API dan nod AI Agent.

WeChat

Namun, Feishu adalah alat kolaborasi perusahaan yang mencakup skenario pejabat. WeChat memiliki kepelbagaian yang berbeza—1.432 bilion pengguna aktif bulanan, ratusan aplikasi kecil dalam pelbagai segmen, dari memesan makanan, mendaftar perubatan, membeli tiket pesawat hingga membayar bil air dan elektrik, hampir mencakup semua keperluan perkhidmatan dalam kehidupan harian seseorang.

WeChat

Jika AI WeChat benar-benar mampu memanggil aplikasi kecil ini dengan lancar untuk menyelesaikan tugas, maka seperti yang diramalkan, ia telah menjadi sistem operasi yang boleh dioperasikan dengan bahasa semula jadi.

Pengguna mengatakan, “Tolong tempah kereta api berkelajuan tinggi dari Beijing ke Shanghai pada pukul 3 petang esok,” AI menguraikan niat, memanggil program kecil 12306 untuk semak tiket, pilih tempat duduk, dan selesaikan pembayaran melalui WeChat, semuanya berlaku tanpa keluar dari WeChat. Rantai ini secara teori boleh dilaksanakan hari ini.

Tentu, masih ada jarak antara teori dan realiti. Panggilan AI terhadap perkhidmatan yang melibatkan skenario pembayaran mempunyai kadar ralat hampir sifar—mengklik salah satu kopi adalah perkara kecil, tetapi membeli tiket pesawat yang salah adalah perkara besar. Keperluan ketepatan model asas jauh lebih tinggi berbanding skenario perbualan. Ini juga merupakan halangan umum yang dihadapi oleh AI Agent di seluruh dunia: antara "bisa berbual" dengan "bisa melakukan tindakan", yang memisahkan bukanlah indikator teknikal, tetapi kepercayaan.

WeChat

Namun, WeChat paling tidak berjaya dalam satu perkara: ia tidak membina rangkaian perkhidmatan dari sifar. Selama bertahun-tahun, apa yang ChatGPT lakukan ialah memulakan dengan otak yang bijak, kemudian menyambungkan satu persatu dengan Shopify, DoorDash, Stripe, setiap sambungan dibina dari sifar, dan sehingga hari ini, peratusan pertanyaan yang berkaitan dengan transaksi masih kurang daripada 3%.

Perubahan yang benar-benar akan berlaku, bagi kebanyakan pengguna, mungkin berlaku tanpa disedari. Suatu hari, anda mengetik satu pesan di WeChat, “Bantu saya tempah tiket ke Shanghai jam sembilan malam ini,” dan ia sudah ditempah, tanpa anda mengetahui aplikasi kecil mana yang dipanggil atau proses pembayaran apa yang dilalui.

“Tanpa kesedaran penyelesaian” inilah tanda kematangan sebenar AI Agent, dan WeChat lebih dekat kepada langkah ini daripada siapa pun.

Artikel ini berasal daripada akaun微信公众号 "APPSO", penulis: APPSO yang menemui produk masa depan