WeChat Meluncurkan Ekosistem Mini Program Berbasis AI, Mengungguli Apple dalam Integrasi AI

AI dari WeChat akhirnya bergerak.

Pada hari yang sama dengan WWDC Apple, WeChat melakukan sesuatu yang mungkin lebih penting daripada Apple, dengan merilis pengumuman sederhana: "Panduan untuk Pengembang dalam Mengintegrasikan Ekosistem AI WeChat".

WeChat

Mulai hari ini, pengembang小程序 dapat memberikan otorisasi agar AI WeChat dapat membaca, mengoperasikan, dan memanggil fungsi小程序.

WeChat menyediakan dua cara integrasi: satu "mode otomatis", dengan ambang batas hampir nol, pengembang hanya perlu mengaktifkan satu saklar, platform akan membaca kode sumber, menganalisis halaman, memahami apa yang dapat dilakukan oleh小程序, lalu AI dapat langsung mengoperasikannya tanpa menulis satu baris kode pun.

另一种称为 “开发模式”，开发者自行开发定制化的 Skill，通过审核后可被 AI 调用。两种模式可同时开启。美团已宣布接入。

Ini bukan sekadar memahami sebagai peluncuran fitur baru lagi, tetapi harus dilihat bahwa WeChat sedang mengubah seluruh ekosistemnya—jutaan program mini, WeChat Pay, pemberitahuan layanan, akun publik—menjadi lapisan eksekusi AI.

Telusuri dokumen Skill, bagaimana AI WeChat memanggil mini program?

Dokumen terbuka WeChat mengungkapkan spesifikasi teknis untuk integrasi AI Skill ke dalam小程序, perhatikan dengan seksama, karena di dalamnya tersembunyi banyak detail desain.

Dokumentasi skill resmi dapat ditemukan di👇🏻:

https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

WeChat

Dari segi arsitektur, pengembang AI akan langsung mengenali bahwa pada dasarnya ini adalah MCP. File mcp.json mendeklarasikan fungsi dan parameter setiap antarmuka atom, sedangkan SKILL.md menjelaskan bagaimana seluruh alur bisnis dijalankan, yang hampir identik dengan arsitektur MCP+Skills di Claude, Cursor, dan VS Code. WeChat tidak memulai dari nol, melainkan langsung mengadopsi standar industri yang sedang berkonsolidasi.

Dalam panduan tersebut, WeChat menyediakan sistem "bobot perhatian" yang sangat jelas. Saat AI memutuskan memanggil antarmuka mana dan menghasilkan parameter apa, yang paling diutamakan adalah content yang dikembalikan oleh antarmuka (bintang lima), diikuti oleh description antarmuka dan description parameter di mcp.json (masing-masing bintang empat), sedangkan SKILL.md berada di posisi terakhir (bintang tiga). Ini berarti lokasi penulisan pengembang lebih penting daripada isi yang ditulis—aturan yang sama, jika ditulis di content antarmuka dan jika ditulis di SKILL.md, akan mendapat bobot yang sama sekali berbeda dari AI.

WeChat

Pada tingkat pengembalian antarmuka, ada satu aturan inti: format dua bagian "Fakta + Tindakan". Pertama, beri tahu AI "apa yang terjadi", lalu beri tahu "apa yang harus dilakukan selanjutnya". Jika hanya menulis tindakan tanpa fakta, AI bisa salah memahami "tampilkan kartu" sebagai "siap memanggil antarmuka berikutnya" dan melewati konfirmasi pengguna. Ini adalah aturan yang baru dipahami setelah mengalami banyak kesalahan.

WeChat

Keempat, gunakan ID alih-alih bahasa alami untuk pengiriman parameter. Dengan contoh skenario "pemesanan kopi" pada gambar, setelah pengguna menyampaikan permintaan, AI memahami niat yang ambigu, memilih opsi, mengubah spesifikasi, dan menangani pembayaran, semuanya tanpa keluar dari kotak dialog.

Desain ini mengindikasikan bahwa WeChat telah menguji cukup banyak kasus dalam praktik, memahami jebakan dalam pemanggilan AI terhadap layanan eksternal, dan mengubah pengalaman ini menjadi standar pengembang.

Sebenarnya, jika dibandingkan dengan小程序 WeChat dan aplikasi Apple yang juga dikenal karena「ekosistem」nya, WeChat memiliki「sudut pandang Tuhan」terhadap ekosistemnya sendiri, yang menjadi prasyarat semua pencapaian ini.

Bagaimana bisa lebih penting daripada AI Apple?

Siri AI versi baru yang dirilis Apple di WWDC tahun ini, meskipun menggunakan Google Gemini sebagai dasar dan mendukung pembuatan Shortcut melalui bahasa alami, tidak menimbulkan banyak diskusi.

WeChat

Dengan melihat lebih dekat, Anda akan melihat perbedaannya: Apple membuat AI mengoordinasikan beberapa fungsi asli dalam sistem iOS, tetapi ketika melibatkan aplikasi pihak ketiga, aplikasi-aplikasi yang terpasang di ponsel Anda, ia akan kesulitan.

Misalnya Ele.me, kode-nya berjalan di server Ele.me sendiri, yang tidak dapat dibaca oleh Apple. Untuk mengakses Ele.me, Siri harus memiliki insinyur Ele.me yang secara aktif mengintegrasikan antarmuka App Intents, satu per satu, yang memakan waktu dan tenaga.

WeChat

Sementara WeChat memungkinkan AI untuk secara langsung mengoperasikan jutaan layanan pihak ketiga, karena小程序 berbeda. Setiap kode小程序, mulai dari pengiriman pengembang, melalui tinjauan WeChat, hingga akhirnya berjalan di ponsel pengguna, seluruh prosesnya berada dalam sistem teknis WeChat. WeChat dapat memindai kode selama tahap tinjauan, menganalisis otomatis «berapa banyak halaman yang dimiliki小程序 ini, apa yang bisa dilakukan, serta apa input dan output-nya».

Jadi, "mode otomatis" baru bisa berfungsi—pengembang tidak perlu menulis satu baris kode pun, cukup nyalakan saklar, dan WeChat sendiri akan menerjemahkan aplikasi mini Anda menjadi alat yang dapat dipanggil oleh AI. Infrastruktur dasar WeChat secara alami mendukung hal ini, karena ia memiliki "sudut pandang Tuhan" dan mampu melakukan penjadwalan berbasis terpusat.

Keunggulan arsitektur ini tidak dimiliki oleh Apple maupun Google.

Perlu dicatat juga bahwa baru-baru ini dilaporkan bahwa WeChat sedang bekerja sama dengan Huawei, Honor, Xiaomi, OPPO, dan vivo untuk meluncurkan kemampuan A2A (Agent-to-Agent), memungkinkan pengguna untuk secara langsung memulai panggilan video atau pesan WeChat melalui asisten suara ponsel mereka.

WeChat

Secara internal, AI WeChat dapat mengakses jutaan program mini; secara eksternal, asisten AI pabrikan ponsel dapat mengakses WeChat. WeChat sedang menjadi penghubung super di era AI, menjadi pusat layanan yang dapat diakses oleh semua AI.

Ramalan lama tentang "WeChat OS"

Ketika fitur小程序 diluncurkan, banyak orang bercanda bahwa WeChat akan membuat "WeChat OS". Pada saat itu, ini lebih seperti sebuah gaya bahasa—小程序 menggantikan sebagian fungsi aplikasi, tetapi pada dasarnya tetap merupakan "platform aplikasi ringan".

Lebih kebetulan lagi, mekanisme pemeriksaan terpusat yang dirancang pada waktu itu bertujuan untuk mengendalikan kualitas dan keamanan. Tetapi sembilan tahun kemudian, desain yang awalnya dikritik sebagai "pengawasan berlebihan" justru menjadi keunggulan infrastruktur di era AI. Ekosistem App terdistribusi (Apple/Android) pada waktu itu tampak lebih "bebas", tetapi sekarang malah menjadi hambatan dalam akses AI.

WeChat

Sebuah ramalan lama mengalami perubahan revolusioner karena munculnya teknologi era baru—AI.

Saat sebelumnya menulis tentang OpenClaw dan Feishu, saya pernah menyampaikan sebuah penilaian: IM adalah pintu masuk paling alami bagi AI Agent, karena percakapan merupakan cara interaksi paling alami antara manusia dan AI, sementara ekosistem layanan IM yang sudah ada (robot, pembayaran,小程序) memungkinkan AI tidak hanya bisa 'berbicara' tetapi juga 'melakukan'. Feishu sudah bergerak ke arah ini dengan meluncurkan peningkatan Bot API dan node AI Agent.

WeChat

Namun, Feishu adalah alat kolaborasi perusahaan yang mencakup skenario perkantoran. WeChat memiliki cakupan yang sama sekali berbeda—1,432 miliar pengguna aktif bulanan, ratusan aplikasi mikro di berbagai segmen, mulai dari memesan makanan, pendaftaran dokter, membeli tiket pesawat, hingga membayar tagihan listrik dan air, hampir mencakup seluruh kebutuhan layanan sehari-hari seseorang.

WeChat

Jika AI WeChat benar-benar dapat secara lancar memanggil aplikasi mini ini untuk menyelesaikan tugas, maka seperti yang diprediksi, ia telah menjadi sistem operasi yang dapat dioperasikan dengan bahasa alami.

Pengguna mengatakan, “Tolong pesan kereta cepat dari Beijing ke Shanghai besok pukul 15.00,” AI memecah niat tersebut, memanggil小程序 12306 untuk memeriksa tiket, memilih kursi, dan menyelesaikan pemesanan melalui pembayaran WeChat, semuanya dilakukan tanpa keluar dari WeChat. Rantai ini secara teoritis dapat berjalan hari ini.

Tentu, masih ada jarak antara teori dan kenyataan. Panggilan AI yang melibatkan skenario pembayaran memiliki tingkat toleransi kesalahan hampir nol—mengklik salah satu kopi adalah hal kecil, tetapi membeli tiket pesawat yang salah adalah hal besar. Persyaratan akurasi model dasar jauh lebih tinggi daripada dalam skenario percakapan. Ini juga merupakan hambatan umum yang dihadapi oleh AI Agent di seluruh dunia: dari "bisa berbicara" ke "bisa melakukan tugas", jaraknya bukanlah indikator teknis, melainkan kepercayaan.

WeChat

Namun, WeChat setidaknya melakukan satu hal dengan benar: ia tidak membangun jaringan layanan dari nol. Selama bertahun-tahun, yang dilakukan ChatGPT adalah memiliki otak yang cerdas terlebih dahulu, lalu secara perlahan menghubungkan ke Shopify, DoorDash, Stripe, masing-masing koneksi dibangun dari nol, hingga hari ini, persentase pertanyaan terkait transaksi masih kurang dari 3%.

Perubahan yang benar-benar akan terjadi, bagi sebagian besar pengguna, mungkin akan berjalan tanpa terasa. Suatu hari, Anda mengetikkan pesan di WeChat, “Bantukan saya memesan tiket ke Shanghai pukul sembilan malam ini,” lalu pesanan itu langsung selesai, bahkan tanpa Anda menyadari aplikasi kecil mana yang dipanggil atau proses pembayaran apa yang digunakan.

“Tanpa kesadaran akan penyelesaian” inilah tanda kedewasaan sejati dari AI Agent, dan WeChat lebih dekat ke langkah ini daripada siapa pun.

Artikel ini berasal dari akun WeChat "APPSO", penulis: APPSO yang menemukan produk masa depan