स्रोत:a16z
संकलन: फेलिक्स, PANews
एजेंटिक कॉमर्स का युग आ चुका है।
OpenAI का AI एजेंट ई-कॉमर्स प्रोटोकॉल (ACP) और Google का यूनिवर्सल ई-कॉमर्स प्रोटोकॉल (UCP) ChatGPT और Gemini में चेकआउट सुविधा की घोषणा करते हैं। जल्द ही, दुनिया भर के करोड़ों उपभोक्ता बेहतर उत्पाद पाएंगे, व्यापारियों की रूपांतरण दर बढ़ेगी, और प्लेटफॉर्म 5-10% का कमीशन कमाएंगे।
हालाँकि, ChatGPT का चेकआउट फ़ंक्शन केवल एक धीमी सुधार है। यह समाज को 21वीं सदी की शुरुआत के इंटरनेट की तरह बदल नहीं देगा, लेकिन ओपन एजेंट बिजनेस कर सकता है।
हमें कारण को समझने के लिए 1990 के दशक में वापस जाना होगा।
दो आपस में प्रतिस्पर्धी “इंटरनेट” संस्करण मौजूद थे।
AOL संस्करण: एकीकृत मूल्य, ईमेल, मौसम की भविष्यवाणी, अतिरिक्त समीक्षा सामग्री, और अंततः पूरा टाइम वॉर्नर कंटेंट लाइब्रेरी।
ओपन प्रोटोकॉल: HTTP, DNS, HTML और Mosaic नामक एक ब्राउज़र।
Mosaic की तुलना में AOL का संस्करण बिल्कुल हास्यास्पद लगता था। Mosaic पर वेबसाइट्स की संख्या बहुत कम थी, इसलिए खोज फ़ंक्शन की कोई आवश्यकता नहीं थी, एक वर्णानुक्रमिक सूची पर्याप्त थी। आठ साल बाद, AOL ने टाइम वॉर्नर के साथ 3500 अरब डॉलर के मूल्य पर समान विलय की समझौता किया। बाजार ने चयन कर लिया है: चयनित सामग्री ही भविष्य की दिशा है।
लेकिन जल्द ही, मॉज़ाइक और ओपन प्रोटोकॉल ने जीत हासिल कर ली, और मानव सभ्यता ने आधिकारिक रूप से डिजिटल युग में प्रवेश कर लिया। क्यों? सोचिए कि अगर बंद पारिस्थितिकी तंत्र अंततः जीत जाते, तो क्या होता?
2004 में, ज़करबर्ग ने Facebook शुरू करना चाहा, उसे AOL के साथ वितरण समझौता करना था। स्टैनफोर्ड विश्वविद्यालय के दो छात्रों ने वेब इंडेक्स बनाना चाहा, उन्हें CompuServe की अनुमति लेनी थी। एक व्यक्ति अपनी गैरेज में ऑनलाइन किताबें बेचना चाहता था, उसे MSN के कंटेंट टीम को प्रस्ताव भेजना था।
वे ऐसा कहेंगे: “वापस स्कूल जाओ, छोटे बच्चों”। ये सब कुछ कभी नहीं होगा। हम जिस पूरे डिजिटल अर्थव्यवस्था को सामान्य मानते हैं, वह मौजूद ही नहीं होगी।
ओपन प्रोटोकॉल का अर्थ है कि कोई “गेटकीपर” नहीं है। कोई भी सर्वर और डोमेन नाम रखने वाला पूरे इंटरनेट तक पहुँच सकता है। किनारों पर निरंतर नवाचार होता रहता है, जबकि केंद्रीय क्षेत्र उसके साथ नहीं बढ़ पाते, जिससे मानव इतिहास की सबसे बड़ी संपत्ति निर्माण घटनाओं में से एक का जन्म हुआ। यह पूंजीवाद का एक मूलभूत सिद्धांत है: नवाचार किनारों से शुरू होता है।
1997 वापस जाएं: टिम बर्नर्स-ली, मार्क एंड्रीसेन आदि प्रोटोकॉल और ब्राउज़र पर काम कर रहे थे। उस समय, एक सर्वर चलाने में दहलाख़्तर लाखों डॉलर खर्च होते थे। अज्ञात उपयोगकर्ताओं के अनुरोधों का उत्तर देने का क्या मतलब था, यह स्पष्ट नहीं था। ऐसा करना महंगा था, और कोई भी आर्थिक प्रोत्साहन ज्ञात नहीं था।
उन्होंने "402" नामक एक संदेश स्टेटस कोड बनाया, जिसे सर्वर उपयोगकर्ता को भेज सकता था: "इस सामग्री को प्राप्त करने के लिए थोड़ी राशि का भुगतान करें।" लेकिन उस समय डिजिटल भुगतान का कोई उचित तरीका नहीं था। PayPal अभी तक नहीं आया था, और क्रेडिट कार्ड के लिए निश्चित शुल्क दर्जनों सेंट थे, जो 1 सेंट की सूक्ष्म लेनदेन के लिए बहुत अधिक थे।
हालांकि, इंटरनेट फला-फूला।
गूगल ने इंटरनेट के लिए एक अनूठा व्यावसायिक मॉडल खोजा: विज्ञापन। पारंपरिक मीडिया में, मुख्य आर्थिक संबंध सामग्री निर्माता और उपभोक्ता के बीच होते हैं। गूगल ने रेडियो के आर्थिक मॉडल को अपनाया और तीसरा पक्ष: विज्ञापनदाता को शामिल किया। वे सामग्री निर्माता और उपभोक्ता के बीच के संबंध के लिए भुगतान करते हैं।
यह बहुत ही चतुराई से किया गया है। आजकल उत्पादक दर्शकों के ध्यान को मुद्रा में बदल सकते हैं। उन्हें उपभोक्ताओं के साथ पहले से कोई संबंध बनाने की आवश्यकता नहीं है। गूगल विज्ञापनदाताओं और सामग्री उत्पादकों के बीच धन प्रवाह में स्थित है और वह जितना चाहे उतना कमीशन लेता है।
इसलिए, लघु भुगतान की मांग को नजरअंदाज कर दिया गया। ओपन सोर्स सॉफ्टवेयर ने शुरुआत की, क्लाउड कंप्यूटिंग क्रांति शुरू हुई, और होस्टिंग लागत 100 गुना घट गई। गूगल फ्री और ओपन इंटरनेट का सबसे बड़ा समर्थक बन गया। जितना अधिक उपभोक्ता खोजते हैं, उतना ही अधिक गूगल कमाता है। इसलिए, उन्होंने हजारों अरब डॉलर का निवेश किया, ताकि इंटरनेट तेज, सस्ता और सर्वव्यापी बन जाए।
फिर 2010 के दशक में, सब कुछ ऐसा ही लगता था।
ब्याज दरें निम्न हैं, तकनीकी विकास धीमा है, और बंद पारिस्थितिकी तंत्र लगातार बढ़ रहे हैं।
2022 में, ChatGPT लॉन्च हुआ, और दुनिया फिर से बदलने वाली थी। बड़े भाषा मॉडल (LLMs) केवल परिणाम प्रदान करने तक ही सीमित नहीं हैं। वे कई ऐसे परिणामों को उत्पन्न कर सकते हैं और उन्हें एक संक्षिप्त और स्पष्ट सारांश में संकलित कर सकते हैं, और अक्सर सामग्री को स्पर्श किए बिना।
जब GPT-4 आया, तो स्थिति स्पष्ट हो गई: एजेंट ही अगला कदम है: LLM मानवों की तरह कंप्यूटर का उपयोग करने में कुशल हैं और इसकी लागत कम और दक्षता अधिक है।
And thus, the economic landscape of the internet has changed.
1997 से 2024 तक, व्यापार मॉडल का केंद्र "ध्यान भंग विपणन" था। मनुष्य वेब पेज पढ़ते समय विज्ञापनों से आसानी से ध्यान भंग हो जाते हैं, और विज्ञापनदाता अपनी सीमित ध्यान क्षमता का लाभ उठाते हैं। लेकिन निम्न स्तरीय एजेंट/एजेंट ध्यान भंग नहीं होते।
इसमें एक अद्भुत विरोधाभास छिपा है: विज्ञापनों ने मुक्त और खुले इंटरनेट का निर्माण किया, जिसने 10 ट्रिलियन टोकन के बड़े डेटासेट को जन्म दिया, जिससे LLM उत्पन्न हुए, और अंततः विज्ञापनों का पतन हुआ।
GPT-4 के लॉन्च के बाद से, Stack Overflow के विज़िट 75% घट गए हैं, और टेक न्यूज़ का ट्रैफ़िक 60% घट गया है। टेक उपयोगकर्ता पहले उपयोगकर्ता हैं, लेकिन यह रुझान अंततः इंटरनेट पर सभी जानकारी को छा जाएगा।
ChatGPT में चेकआउट सुविधा महत्वपूर्ण नहीं है। इंटरनेट सभ्यता का चौक बन गया है, और पारंपरिक आर्थिक अनुबंध पुराने हो चुके हैं।
इंटरनेट पर कुछ छोटे क्षेत्र सफलतापूर्वक गूगल के "अपरदन" का सामना कर रहे हैं, वे वास्तविक अनूठी सामग्री वाले "बंद बगीचे" की तरह हैं: Facebook, TikTok और LinkedIn। हजारों उच्च वेतन वाले इंजीनियरों द्वारा रात-दिन मेहनत करने के कारण ये क्षेत्र स्वचालित रोबोट्स के स्क्रैपिंग से बच पाए हैं।
लेकिन, बाड़ वाले बगीचे की रक्षा भी तोड़ दी गई है। कंप्यूटर का उपयोग करने में सक्षम एजेंट सच्चे मानव उपयोगकर्ताओं के ट्रैफ़िक को पूरी तरह से अनुकरण कर सकते हैं। भविष्य के 10 वर्षों में, धोखेबाज़ विभिन्न "जादुई दवाओं" की बिक्री करेंगे, और सिलिकॉन वैली (PAnews का संदर्भ: सिलिकॉन वैली के निवेशक) की पूंजी भी इसके साथ चलेगी। लेकिन, वास्तव में, कोई जादुई दवा नहीं है। महल की दीवारें विमानों द्वारा नष्ट कर दी गई हैं।
What's next?
Open Agent Commerce.
ChatGPT में चेकआउट सुविधा बुद्धिमान एजेंट व्यापार के युग की AOL की तरह है। यह एक चयनित निर्देशिका है, एक बेहतर उपयोगकर्ता अनुभव वाला बंद बगीचा। इसके माध्यम से बिक्री करने के लिए, व्यापारियों को कई महीनों का व्यापार विकास, कठोर कानूनी दस्तावेज, विशिष्ट पांच वर्षीय योजना, महत्वपूर्ण आय, मजबूत उपयोगकर्ता आधार, और एक ऐसी कहानी की आवश्यकता होती है जो The New York Times के मुखपृष्ठ पर आने पर शेयरधारकों को संतुष्ट कर सके।
ओपन एजेंट बिजनेस आज के HTTP की तरह है। यह एक सरल प्रोटोकॉल सेट है जो एजेंट्स को अपनी आवश्यकताओं के लिए किसी भी चीज़ के लिए भुगतान करने की अनुमति देता है। डेटा, क्लाउड होस्टिंग, संचार, और कई ऐसी चीज़ें जिनकी हमने अभी तक कल्पना नहीं की है।
Coinbase का x402 और Tempo का Stripe के साथ लॉन्च किया गया MPP दो प्रमुख नेताओं में से हैं। “402” स्टेटस कोड के आविष्कार के 28 वर्ष बाद, हमारे पास अब एक कार्यात्मक लागूकरण है। आधुनिक ब्लॉकचेन पर स्थिर मुद्रा लेनदेन की लागत एक सेंट से कम है, जो 1997 में लघु भुगतान को विफल करने वाली स्थिर शुल्क समस्या को हल करती है।
एक ऐसा एजेंट जो केवल पूर्व-अनुमोदित व्यापारियों से ही खरीदारी कर सकता है, वह एक कंपनी क्रेडिट कार्ड जैसा है जिसे केवल तीन आपूर्तिकर्ताओं पर ही खर्च किया जा सकता है। जबकि एक खुले प्रोटोकॉल वाला एजेंट, एक बैंक खाता रखने वाले उद्यमी के समान है।
यहाँ कोई BD नहीं है, कोई व्हाइटलिस्ट नहीं है, केवल सरल, अनुमति-रहित मानक हैं।
ये प्रोटोकॉल केवल दो चीजों पर ध्यान केंद्रित करते हैं:
मैं भुगतान कैसे करूँ?
व्यापारी: "मैं कैसे सुनिश्चित करूँ कि एजेंट ने भुगतान कर दिया है?"
LLM अपने द्वारा कभी नहीं देखे गए उपकरणों को कॉल करने में कुशल हैं। Claude 4.5+ और Codex 5.2+ मॉडल्स से, एजेंट्स को पहले से प्रशिक्षित किए बिना API की खोज करनी, उनके स्कीमा को पढ़ना और उनका सही ढंग से उपयोग करना होता है।
वर्तमान चर्चा मुख्य रूप से “कौशल (skills)” पर केंद्रित है। आप उन्हें प्राकृतिक भाषा प्रोग्राम के रूप में कल्पना कर सकते हैं, जिन्हें ब्लॉकों की तरह जोड़ा जा सकता है। एक गैर-तकनीकी पृष्ठभूमि के संस्थापक एक Slack संदेश लिख सकते हैं और इसे सॉफ्टवेयर की तरह कार्यान्वित कर सकते हैं:
अपने पास के अच्छी रेटिंग वाली पिज़्ज़ा स्टोर से पिज़्ज़ा ऑर्डर करें और हर 10 मिनट में डिलीवरी स्टेटस ट्रैक करें।
जब डिलीवरी बॉय 5 मिनट के भीतर पहुँचेगा, तो बरामदे का बल्ब जला दें।
अगर 30 मिनट में डिलीवर किया जाता है, तो डिलीवरी बॉय को 5 डॉलर का टिप दें।
कोड लिखने की आवश्यकता नहीं है, और न ही कंप्यूटर विज्ञान की डिग्री की। एजेंट इरादे को पढ़ता है, समय पर एक कंप्यूटर-नेटिव प्रोग्राम लिखता है, इसे निष्पादित करता है, और फिर इसे फेंक देता है। प्रोग्रामिंग को एक विषय बनाए रखने की आवश्यकता नहीं है, मानव मातृभाषा को समझना पर्याप्त है।
कौशल वास्तव में कारगर हैं। लेकिन वे केवल एक अस्थायी उत्पाद हैं, जो हमारे द्वारा एजेंट के अपरिचित उपकरणों को कॉल करने की क्षमता की खोज के बाद सबसे पहले विचारित बनाने का तरीका था। इन्हें किसी द्वारा लिखना, प्रकाशित करना, सुरक्षा जांच करना और अपडेट करना पड़ता है। और एजेंट को इन्हें पहले से लोड करना पड़ता है। यह बहुत परेशानी भरा है।
स्किल पर चर्चा एक गहरी उपलब्धि को छुपा रही है: एजेंट अभूतपूर्व तरीके से विभिन्न क्षमताओं को जोड़ सकते हैं।
पिज्जा खरीदना केवल एक सरल उदाहरण है। यहाँ एक अधिक वास्तविक मामला है: एक छोटे व्यवसाय की आपूर्ति श्रृंखला को प्रबंधित करने वाला एजेंट ने ध्यान दिया कि शुल्क के कारण पैकेजिंग आपूर्तिकर्ता की कीमतें 15% बढ़ गई हैं। इसने तीन स्थानीय विकल्प ढूंढे, प्रत्येक आपूर्तिकर्ता से नमूने माँगे, बड़ी मात्रा में कीमतों पर बातचीत की, और अंततः स्विच कर दिया। यह सब व्यवसाय मालिक के सुबह के व्यायाम से पहले पूरा हो चुका था।
कोई API साझेदारी, खरीद टीम या निविदा प्रक्रिया की आवश्यकता नहीं है। केवल एक ऐसा एजेंट चाहिए जिसके पास बैलेंस हो और ओपन प्रोटोकॉल का उपयोग करे।
पाया गया
एजेंट भुगतान कर सकता है, क्षमताओं को संयोजित कर सकता है, लेकिन अभी भी आवश्यक सामग्री नहीं ढूंढ सकता।
बाकी सवाल "खोज" है। एजेंट के लिए: "मैं अपनी खरीदारी के लिए क्या ढूंढू?" व्यापारी के लिए: "मैं अपनी सेवा को एजेंट को कैसे प्रस्तुत करूं?"
AgentCash का उदय हुआ। यह एक एकीकृत खाता है जो इंटरनेट पर सभी API तक पहुँच प्रदान करता है। जब एजेंट ब्लॉक किया जाता है, तो यह हजारों API तक पहुँच सकता है और बहुत कम लागत पर कार्य करना जारी रख सकता है।
मुख्य बात यह है कि AgentCash भुगतान और व्यापारी खोज सुविधाओं को एकीकृत करता है। व्यापारी अपने सर्वर को x402scan.com या mppscan.com पर पंजीकृत कर सकते हैं और तुरंत अपनी सेवाओं को 2000 से अधिक AgentCash एजेंट्स के सामने प्रस्तुत कर सकते हैं।
1997 में, इंटरनेट का कोई व्यावसायिक मॉडल नहीं था, कोई नहीं जानता था कि सर्वर क्यों अज्ञात व्यक्तियों के साथ संचार करें। खुले प्रोटोकॉल और "विज्ञापन" नामक एक रणनीति ने इस समस्या का चतुराई से समाधान किया, जिससे सभ्यता डिजिटल युग में प्रवेश करने लगी। 2026 तक, यह चतुराईपूर्ण रणनीति लुप्त हो रही है। खुले प्रोटोकॉल और 28 साल पुरानी स्थिति कोड के साथ इसका स्थान लेने जा रहा है।
आपका स्वागत है ओपन एजेंट बिजनेस एज के लिए।
संबंधित पढ़ें: एक्स402 और एमपीपी को समझें: एजेंट भुगतान के दो मार्ग
