WeChat का AI, अंततः चल पड़ा।
एप्पल WWDC के उसी दिन, वेशान ने एक ऐसा काम किया जो एप्पल से अधिक महत्वपूर्ण हो सकता है, और एक सादगी से भरा घोषणापत्र जारी किया: "विकासकों के लिए वेशान AI इकोसिस्टम में एकीकरण का मार्गदर्शन".

आज से, छोटे कार्यक्रम विकासक अपने छोटे कार्यक्रम के पढ़ने, संचालन और कॉल करने के लिए वेक्सिन एआई को अधिकृत कर सकते हैं।
वेइक्सिन ने दो समावेशन विकल्प प्रदान किए हैं: एक "ऑटोमेटिक मोड" जिसकी बाधा लगभग शून्य है, जहां डेवलपर एक स्विच ऑन करता है, प्लेटफॉर्म स्वयं स्रोत कोड पढ़ता है, पेज का विश्लेषण करता है, छोटे प्रोग्राम क्या कर सकता है यह समझता है, और फिर AI सीधे संचालन करने लगता है, बिना किसी कोड लिखे।
एक अन्य "डेवलपमेंट मोड" कहलाता है, जिसमें डेवलपर्स अपने खुद के कस्टमाइज्ड स्किल विकसित करते हैं और एआई द्वारा उपयोग के लिए अनुमोदन के बाद। दोनों को एक साथ सक्षम किया जा सकता है। मेन्गुआन ने पहले ही इसमें शामिल होने की घोषणा कर दी है।
इसे केवल एक नए फीचर के रूप में नहीं समझना चाहिए, बल्कि यह देखना चाहिए कि वेइक्सिन अपने पूरे पारिस्थितिकी तंत्र—लाखों माइक्रोप्रोग्राम, वेइक्सिन पेमेंट, सर्विस नोटिफिकेशन, ग्राहक अकाउंट—को AI के एक्जीक्यूशन लेयर में बदल रहा है।
Skill दस्तावेज़ को जांचें, वेक्सिन AI छोटे कार्यक्रम को कैसे कॉल करता है
वेइक्सिन ओपन डॉक्यूमेंट में मिनी प्रोग्राम के लिए AI स्किल टेक्निकल स्पेसिफिकेशन शामिल हैं, ध्यान से देखें, इसमें कई डिज़ाइन विवरण छिपे हुए हैं।
आधिकारिक skill दस्तावेज़ के लिए निर्देश👇🏻:
https://developers.weixin.qq.com/miniprogram/dev/ai/best-practices.html

आर्किटेक्चर के दृष्टिकोण से, AI विकास करने वाले तुरंत पहचान लेंगे कि यह मूल रूप से MCP है। mcp.json प्रत्येक परमाणु इंटरफ़ेस के कार्य और पैरामीटर्स को घोषित करता है, SKILL.md पूरी बिजनेस प्रक्रिया कैसे चलती है, इसे वर्णित करता है, जो Claude, Cursor, VS Code में MCP+Skills आर्किटेक्चर के साथ लगभग बिल्कुल मेल खाता है। वेशीन ने कोई नया सिस्टम नहीं बनाया, बल्कि उद्योग में संकलित हो रहे मानक को सीधे अपना लिया।
निर्देश योजना में, वेशिन्हुआ ने एक स्पष्ट "ध्यान भार" प्रणाली प्रदान की है। AI जब कौन सा एपीआई कॉल करना है और कौन से पैरामीटर जेनरेट करने हैं, इस निर्णय के लिए सबसे पहले एपीआई द्वारा लौटाए गए content (पांच सितारे) को प्राथमिकता देता है, फिर mcp.json में एपीआई description (चार सितारे) और पैरामीटर description (चार सितारे), और SKILL.md को सबसे कम प्राथमिकता (तीन सितारे) देता है। इसका मतलब है कि डेवलपर द्वारा कहाँ लिखना है, यह इससे कि क्या लिखा है, उससे अधिक महत्वपूर्ण है—एक ही नियम, अगर एपीआई लौटाए गए content में लिखा जाए या SKILL.md में, AI द्वारा इसका भार पूरी तरह से अलग होगा।

इंटरफेस रिटर्न स्तर पर एक मूल नियम है: 'तथ्य + कार्रवाई' दो-खंड ढांचा। पहले AI को बताएं कि 'क्या हुआ', फिर उसे बताएं कि 'अगला कदम क्या है'। अगर केवल कार्रवाई लिखी जाए और तथ्य नहीं, तो AI 'कार्ड प्रदर्शित करें' को 'अगले इंटरफेस को कॉल करने की तैयारी' के रूप में समझ सकता है और उपयोगकर्ता की पुष्टि को छोड़ सकता है। यह एक ऐसा नियम है जिसे कई समस्याओं के बाद ही समझा जा सकता है।

चौथा, पैरामीटर पास करने के लिए प्राकृतिक भाषा के बजाय ID का उपयोग प्राथमिकता दें। चित्र में दिखाए गए 'कॉफी ऑर्डर' स्थिति के साथ, उपयोगकर्ता की आवश्यकता रखने के बाद, AI अस्पष्ट इच्छा, विकल्प, स्पेसिफिकेशन बदलना और भुगतान प्रोसेस करता है, और पूरी प्रक्रिया डायलॉग बॉक्स के बाहर होती है।
इस डिज़ाइन से यह संकेत मिलता है कि वेइक्सिन पर्याप्त संख्या में मामलों को वास्तविक उपयोग में चला चुका है, जिससे यह जानता है कि AI बाहरी सेवाओं को कॉल करने के दौरान किन चुनौतियों का सामना करना पड़ता है, और इन अनुभवों को विकासकर्ता मानकों में स्थिर कर दिया गया है।
वास्तव में, यदि एक ही 'पारिस्थितिकी' के लिए प्रसिद्ध वेइक्सिन मिनी प्रोग्राम और ऐपल ऐप्स की तुलना की जाए, तो वेइक्सिन अपनी पारिस्थितिकी के लिए एक 'दिव्य दृष्टि' रखता है, जो सब कुछ संभव बनाने की पूर्वशर्त है।
कैसे यह ऐप्पल AI से अधिक महत्वपूर्ण है
इस साल एप्पल ने WWDC पर नया Siri AI लॉन्च किया, जिसका बेस लेयर Google Gemini से जुड़ा हुआ है और Shortcuts में प्राकृतिक भाषा के साथ बनाने की सुविधा है, लेकिन इस पर बहुत चर्चा नहीं हुई।

ध्यान से देखने पर अंतर स्पष्ट होता है: ऐप्पल AI को iOS सिस्टम के भीतर कुछ नेटिव फ़ंक्शन्स को समन्वित करने के लिए उपयोग करता है, लेकिन जब यह तीसरे पक्ष के ऐप्स, यानी आपके फोन पर इंस्टॉल किए गए ऐप्स से संबंधित होता है, तो यह संकट में पड़ जाता है।
जैसे कि Ele.me, इसका कोड Ele.me के अपने सर्वर पर चलता है, जिसे Apple पढ़ नहीं सकता। Siri को Ele.me का उपयोग करने के लिए, Ele.me के इंजीनियर्स को App Intents इंटरफ़ेस के साथ सक्रिय रूप से एक-एक करके एकीकृत करना होगा, जिसमें समय और प्रयास लगता है।

वहीं, वेइक्सिन AI को सैकड़ों लाखों तीसरे पक्ष की सेवाओं को सीधे संचालित करने की अनुमति देता है, क्योंकि माइक्रो-प्रोग्राम अलग होते हैं। प्रत्येक माइक्रो-प्रोग्राम का कोड, विकासक द्वारा सबमिट किए जाने से लेकर वेइक्सिन द्वारा समीक्षा और अंततः उपयोगकर्ता के फोन पर चलने तक, पूरी तरह से वेइक्सिन की तकनीकी प्रणाली के भीतर होता है। वेइक्सिन समीक्षा चरण में ही कोड को स्कैन कर सकता है और स्वचालित रूप से विश्लेषण कर सकता है कि "इस माइक्रो-प्रोग्राम के कौन-से पेज हैं, यह क्या कर सकता है, और इनपुट-आउटपुट क्या हैं।"
इसलिए ही "ऑटो मोड" संभव है—डेवलपर को कोई कोड नहीं लिखना पड़ता, सिर्फ एक स्विच ऑन करें, और वेइक्सिन अपने आप आपके माइक्रोप्रोग्राम को AI द्वारा कॉल किए जाने वाले टूल में अनुवाद कर देता है। वेइक्सिन की बुनियादी संरचना इसे करने के लिए प्राकृतिक रूप से समर्थित है, इसमें "देवता का दृष्टिकोण" है, जो केंद्रीकृत ढंग से स्केड्यूलिंग कर सकता है।
इस आर्किटेक्चर का लाभ, ऐप्पल के पास नहीं है, गूगल के पास भी नहीं है।
इसके अलावा, पिछले कुछ समय में यह भी चर्चा में रही कि वेइक्सिन, हुआवेई, होनोर, शाओमी, OPPO और vivo के साथ मिलकर A2A (एजेंट-टू-एजेंट) असिस्टेंट क्षमताएं लॉन्च कर रहा है, जिसके तहत उपयोगकर्ता अपने मोबाइल वॉइस असिस्टेंट के माध्यम से सीधे वेइक्सिन ऑडियो या वीडियो कॉल शुरू कर सकते हैं या संदेश भेज सकते हैं।

अंदर, वेइक्सिन AI लाखों छोटे प्रोग्राम्स को एक्सेस कर सकता है; बाहर, मोबाइल निर्माताओं के AI असिस्टेंट वेइक्सिन को एक्सेस कर सकते हैं। वेइक्सिन AI युग का एक सुपर कनेक्टर बन रहा है, जो सभी AI के लिए एक सेवा हब प्रदान करता है।
'वेइचैन OS' का पुराना भविष्यवाणी
जब लिटिल प्रोग्राम लॉन्च किए गए, तो कई लोगों ने मजाक में कहा कि वेक्सिन "वेक्सिन ओएस" बनने जा रहा है। तब यह अधिकतर एक शैलीगत वाक्यांश लगता था—लिटिल प्रोग्राम कुछ ऐप्स के कार्यों को बदल देते थे, लेकिन मूलतः वे एक "हल्के ऐप प्लेटफॉर्म" ही थे।
अधिक यादृच्छिक रूप से, तब डिज़ाइन किया गया केंद्रीकृत समीक्षा तंत्र गुणवत्ता और सुरक्षा को नियंत्रित करने के लिए था। लेकिन नौ साल बाद, जिसे तब 'अत्यधिक नियंत्रण' के रूप में आलोचित किया गया था, वह अचानक AI युग की बुनियादी ढांचे की ताकत बन गया। वितरित ऐप पारिस्थितिकी (एप्पल/एंड्रॉइड) तब अधिक 'स्वतंत्र' लगती थी, लेकिन अब यह AI एक्सेस के लिए बाधा बन गई है।

एक पुराना भविष्यवाणी, जिसमें नए युग की तकनीक—AI—के आगमन के कारण विप्लवात्मक परिवर्तन हुआ है।
जब मैंने पहले OpenClaw और Feishu के बारे में लिखा था, तो मैंने एक निर्णय दिया था: IM AI Agent का सबसे प्राकृतिक प्रवेश द्वार है, क्योंकि संवाद मनुष्य और AI के बीच सबसे प्राकृतिक इंटरैक्शन है, और IM के स्वयं के सेवा पारिस्थितिकी (रोबोट, भुगतान, माइक्रोप्रोग्राम) के कारण AI केवल 'बात' ही नहीं कर सकता, बल्कि 'कर' भी सकता है। Feishu इस दिशा में बढ़ रहा है, जिसने Bot API और AI Agent नोड्स को लॉन्च किया है।

हालांकि, Feishu एक उद्यम सहयोग उपकरण है जो कार्यालय के संदर्भ को कवर करता है। WeChat की बिल्कुल अलग विस्तार है—14.32 अरब मासिक सक्रिय उपयोगकर्ता, सैकड़ों विशिष्ट क्षेत्रों के लघु कार्यक्रम, जिनमें भोजन का ऑर्डर करने से लेकर अस्पताल में बुकिंग और विमान टिकट खरीदने से लेकर बिजली और पानी का बिल जमा करने तक, लगभग एक व्यक्ति की दैनिक जीवन की सभी सेवा आवश्यकताओं को कवर करते हैं।

अगर वेइचैट AI वास्तव में इन लघु कार्यक्रमों को स्वाभाविक भाषा का उपयोग करके आसानी से निष्पादित कर सकता है, तो जैसा कि भविष्यवाणी की गई थी, यह एक प्राकृतिक भाषा द्वारा संचालित ऑपरेटिंग सिस्टम बन गया है।
उपयोगकर्ता कहता है, "मुझे कल दोपहर 3 बजे बीजिंग से शंघाई तक की उच्च गति वाली ट्रेन का बुकिंग करवा दें," AI इरादे को विघटित करता है, 12306 माइक्रोप्रोग्राम का उपयोग करके टिकट जांचता है, सीट चुनता है, वेक्सिन पेमेंट के माध्यम से ऑर्डर पूरा करता है, और पूरी प्रक्रिया वेक्सिन के भीतर ही पूरी होती है। यह लंबी श्रृंखला सिद्धांत रूप से आज ही काम कर सकती है।
बेशक, सिद्धांत और वास्तविकता के बीच अंतर है। AI के भुगतान स्थितियों में सेवाओं को कॉल करना, त्रुटि सहनशीलता लगभग शून्य होती है—गलती से एक कॉफी ऑर्डर करना छोटी बात है, लेकिन गलती से एक टिकट खरीदना बड़ी बात है। नींव के मॉडल की सटीकता की आवश्यकता संवाद स्थितियों की तुलना में बहुत अधिक होती है। यही वैश्विक AI एजेंट के लागू होने का सामान्य बाधा है: 'बात करने में सक्षम' से 'काम करने में सक्षम' तक, बीच में तकनीकी सूचकांक नहीं, विश्वास है।

लेकिन वेइक्सिन ने कम से कम एक बात सही की: इसने सेवा नेटवर्क को शून्य से नहीं बनाया। इन वर्षों में, ChatGPT ने एक बुद्धिमान दिमाग बनाया, और फिर Shopify, DoorDash, Stripe के साथ एक-एक करके कनेक्शन स्थापित किए, जिनमें से प्रत्येक का कनेक्शन शून्य से बनाया गया, और आज भी लेन-देन से संबंधित पूछताछ का हिस्सा 3% से कम है।
जो वास्तविक परिवर्तन होने वाले हैं, वे अधिकांश उपयोगकर्ताओं के लिए शायद बिना किसी शोर के होंगे। एक दिन आप वेइचैट में टाइप करते हैं, "मुझे आज रात नौ बजे शंघाई के लिए टिकट बुक कर दो", और यह स्वयं बुक हो जाता है, आपको पता भी नहीं चलता कि पीछे कौन सा माइक्रो-प्रोग्राम काम कर रहा है और कौन सी भुगतान प्रक्रिया चल रही है।
यह “अनुभवहीन पूर्णता” AI एजेंट की वास्तविक परिपक्वता का संकेत है, और वेइक्स इस कदम की ओर किसी से भी अधिक निकट है।
यह लेख वेचेन ग्रुप "APPSO" से आया है, लेखक: APPSO जो भविष्य के उत्पादों की खोज करता है
