ब्लॉकचेन कैसे एआई एजेंट्स में पहचान, भुगतान और विश्वास के अंतर को सुलझाता है

लेखक: a16z crypto

अनुवाद: AididiaoJP, Foresight News

AI एजेंट अन्य बुनियादी ढांचे की तुलना में बहुत तेजी से, सहायक उपकरण से वास्तविक आर्थिक भागीदार में विकसित हो रहे हैं।

हालाँकि एजेंट अब कार्यों और लेन-देन करने में सक्षम हैं, लेकिन वे अभी भी इस बात के लिए एक मानकीकृत तरीका नहीं रखते कि "मैं कौन हूँ", "मुझे क्या अधिकार हैं" और "मुझे कैसे भुगतान किया जाएगा।" पहचान स्थानांतरित नहीं हो सकती, भुगतान अभी भी प्रोग्राम करने योग्य नहीं हैं, और सहयोग अभी भी द्वीपों में है।

ब्लॉकचेन इन समस्याओं को बुनियादी ढांचे के स्तर पर हल कर रहा है। सार्वजनिक लेजर प्रत्येक लेनदेन के लिए किसी भी व्यक्ति द्वारा ऑडिट किए जा सकने वाले प्रमाण प्रदान करता है; वॉलेट Agent को स्थानांतरणीय पहचान प्रदान करते हैं; और स्थिर मुद्राएँ एक अन्य निपटान स्तर बन जाती हैं। ये भविष्य की अवधारणाएँ नहीं हैं, ये आज उपलब्ध हैं और Agent को अनुमति के बिना वास्तविक आर्थिक प्रतिनिधि के रूप में कार्य करने में मदद कर सकती हैं।

Provide identity for non-humans

KYA

एजेंट अर्थव्यवस्था का वर्तमान बाधक कौशल नहीं, बल्कि पहचान है।

केवल वित्तीय सेवा क्षेत्र में, गैर-मानवीय पहचानों (स्वचालित व्यापार प्रणालियाँ, जोखिम इंजन, धोखाधड़ी मॉडल) की संख्या पहले ही मानव कर्मचारियों की लगभग 100 गुना है। आधुनिक एजेंट फ्रेमवर्क (टूल कॉलिंग आधारित बड़े मॉडल, स्वायत्त कार्यप्रवाह, बहु-एजेंट ऑर्केस्ट्रेशन) के बड़े पैमाने पर लागू होने के साथ, यह अनुपात सभी क्षेत्रों में बढ़ता रहेगा।

हालाँकि, ये एजेंट अभी भी「बैंक खाता रहित」अवस्था में हैं। वे वित्तीय प्रणाली के साथ बातचीत कर सकते हैं, लेकिन स्थानांतरणीय, सत्यापित, डिफ़ॉल्ट रूप से विश्वसनीय तरीके से नहीं। उनके पास अपनी अधिकारिता को साबित करने, क्रॉस-प्लेटफ़ॉर्म स्वतंत्र रूप से कार्य करने, या अपने कार्यों के लिए जिम्मेदारी लेने का मानकीकृत तरीका नहीं है।

एक सामान्य पहचान परत की कमी है—जो Agent के लिए SSL के समतुल्य होगी और जो बहु-प्लेटफॉर्म सहयोग को मानकीकृत करेगी। वर्तमान समाधान अभी भी टुकड़ों में हैं: एक ओर, ऊर्ध्वाधर एकीकृत, मुद्रा-प्राथमिक स्टैक; दूसरी ओर, क्रिप्टो-नेटिव, खुले मानक (जैसे x402 और उभरते Agent पहचान प्रस्ताव); और अभी तक, अनुप्रयोग परत पहचान को जोड़ने के लिए डेवलपर फ्रेमवर्क विस्तार (जैसे MCP, Model Context Protocol)।

अभी तक कोई व्यापक रूप से अपनाई गई, इंटरऑपरेबल विधि उपलब्ध नहीं है जिससे एक एजेंट दूसरे एजेंट को साबित कर सके कि वह किसका प्रतिनिधित्व करता है, क्या करने की अनुमति है, और कैसे प्रतिफल प्राप्त करता है।

यह KYA (Know Your Agent) की केंद्रीय अवधारणा है। जिस प्रकार मनुष्य विश्वसनीयता रिकॉर्ड और KYC (Know Your Customer) पर निर्भर करते हैं, उसी प्रकार एजेंट को अपने सब्जेक्ट, अधिकार, सीमाओं और प्रतिष्ठा के साथ जोड़ने के लिए क्रिप्टोग्राफिक साइनेचर वाले प्रमाणों की आवश्यकता होगी। ब्लॉकचेन एक उदासीन समन्वय स्तर प्रदान करता है: स्थानांतरणयोग्य पहचान, प्रोग्रामेबल वॉलेट, और चैट ऐप्स, API और बाजारों में वैधीकृत साबितियों को पार्स करने की क्षमता।

हमने प्रारंभिक कार्यान्वयन देखे हैं: ऑन-चेन एजेंट रजिस्ट्री, USDC का उपयोग करने वाला वॉलेट-नेटिव एजेंट, "न्यूनतम विश्वास एजेंट" के लिए ERC मानक, और पहचान को एम्बेडेड भुगतान और धोखाधड़ी नियंत्रण के साथ जोड़ने वाला डेवलपर किट।

लेकिन यूनिवर्सल आइडेंटिटी स्टैंडर्ड के आने से पहले, व्यापारी अभी भी फायरवॉल पर एजेंट को ब्लॉक करते रहेंगे।

AI को चलाने वाली प्रणाली

KYA

एजेंट वास्तविक प्रणाली पर नियंत्रण संभालना शुरू कर देता है, जिससे एक नया प्रश्न उठता है: वास्तव में किसके पास नियंत्रण है? एक समुदाय या कंपनी की कल्पना करें, जिसमें AI प्रणाली महत्वपूर्ण संसाधनों (चाहे पूंजी का आवंटन हो या सप्लाई चेन का प्रबंधन) को समन्वित करती है। भले ही लोग नीति परिवर्तनों के लिए मतदान कर सकें, यदि निम्नस्तरीय AI स्तर एकल प्रदाता द्वारा नियंत्रित है, जो मॉडल अपडेट लागू कर सकता है, प्रतिबंधों को समायोजित कर सकता है या निर्णयों को रद्द कर सकता है, तो इस अधिकार का स्वरूप बहुत कमजोर है। औपचारिक शासन स्तर केंद्रीयकृत हो सकता है, लेकिन संचालन स्तर अभी भी केंद्रीयकृत है—जो मॉडल को नियंत्रित करता है, वही परिणामों को अंततः नियंत्रित करता है।

जब एजेंट शासन की भूमिका निभाते हैं, तो वे एक नया निर्भरता स्तर पेश करते हैं। सिद्धांत रूप से, यह सीधी लोकतंत्र को अधिक संभव बना सकता है: प्रत्येक व्यक्ति के पास एक AI एजेंट हो सकता है, जो जटिल प्रस्तावों को समझने, विकल्पों का मॉडलिंग करने और निर्धारित प्राथमिकताओं के आधार पर मतदान करने में मदद करता है। लेकिन यह दृष्टिकोण केवल तभी संभव है जब एजेंट वास्तव में उन लोगों के प्रति जिम्मेदार हों, जिनका प्रतिनिधित्व करते हैं, जो प्रदाताओं के बीच स्थानांतरित किए जा सकें, और तकनीकी रूप से मानव निर्देशों का पालन करने के लिए सीमित हों। अन्यथा, आपको एक ऐसी प्रणाली मिलती है जो लोकतांत्रिक दिखती है, लेकिन वास्तव में किसी के द्वारा नियंत्रित नहीं होने वाले अपारदर्शी मॉडल के व्यवहार से नियंत्रित होती है।

यदि वर्तमान वास्तविकता यह है कि एजेंट मुख्य रूप से कुछ बुनियादी मॉडल पर आधारित हैं, तो हमें यह साबित करने का तरीका होना चाहिए कि कोई एजेंट उपयोगकर्ता के हित में कार्य कर रहा है, न कि मॉडल कंपनी के हित में। इसके लिए संभवतः कई स्तरों पर क्रिप्टोग्राफिक गारंटी की आवश्यकता होगी: (1) मॉडल इंस्टेंस के आधार पर प्रशिक्षण डेटा, सूक्ष्म-समायोजन या प्रवर्धित शिक्षा; (2) विशिष्ट एजेंट द्वारा अनुसरण किए जाने वाले सटीक प्रॉम्प्ट और निर्देश; (3) इसके वास्तविक दुनिया में वास्तविक व्यवहार का रिकॉर्ड; (4) विश्वसनीय गारंटी कि प्रक्रिया के बाद प्रदाता इसके निर्देशों में परिवर्तन नहीं कर सकता है या उपयोगकर्ता की अनुमति के बिना इसे पुनः प्रशिक्षित नहीं कर सकता है। इन गारंटियों के बिना, एजेंट शासन मॉडल वेट्स पर नियंत्रण रखने वालों द्वारा शासन में अपनी स्थिति कमजोर कर देगा।

यहीं पर क्रिप्टो तकनीक विशेष रूप से कारगर होती है। यदि सामूहिक निर्णय ब्लॉकचेन पर रिकॉर्ड किए जाते हैं और स्वचालित रूप से निष्पादित किए जाते हैं, तो AI प्रणालियों को सत्यापित परिणामों का कठोरता से पालन करने के लिए निर्देश दिए जा सकते हैं। यदि एजेंट के पास क्रिप्टोग्राफिक पहचान और पारदर्शी निष्पादन लॉग हैं, तो लोग अपने एजेंट की जांच कर सकते हैं कि क्या वे सीमाओं के भीतर काम कर रहे हैं। यदि AI स्तर उपयोगकर्ता-स्वामित्ववाला और स्थानांतरणयोग्य है, और केवल एकल प्लेटफॉर्म पर बंद नहीं है, तो कोई भी कंपनी एकल मॉडल अपडेट से नियम बदलने में सक्षम नहीं होगी।

अंततः, AI प्रणालियों के शासन की मूलभूत चुनौती नीति नहीं, बल्कि बुनियादी ढांचे की चुनौती है। वास्तविक अधिकार उस प्रणाली में निहित लागू करने योग्य गारंटियों पर निर्भर करता है।

AI-निर्मित व्यवसाय के लिए पारंपरिक भुगतान प्रणाली का अंतर पूरा करें

KYA

AI एजेंट विभिन्न सेवाओं—वेब स्क्रैपिंग, ब्राउज़र सत्र, चित्र उत्पादन—खरीदना शुरू कर रहे हैं, और स्थिर मुद्राएँ इन लेनदेन के लिए वैकल्पिक समापन परत बन रही हैं। इसी बीच, एजेंट के लिए एक नया बाजार विकसित हो रहा है। उदाहरण के लिए, Stripe और Tempo का MPP बाजार AI एजेंट के लिए डिज़ाइन की गई 60 से अधिक सेवाओं को एकत्रित करता है। पहले सप्ताह में 34,000 से अधिक लेनदेन संभाले गए, जिनकी शुल्क 0.003 डॉलर तक है, और स्थिर मुद्राएँ एक पूर्वनिर्धारित भुगतान विकल्प हैं।

इन सेवाओं के एक्सेस के तरीके में अंतर है: इनके पास चेकआउट पेज नहीं होता। एजेंट स्कीमा पढ़ता है, अनुरोध भेजता है, भुगतान करता है और एक ही एक्सचेंज में आउटपुट प्राप्त करता है। यह एक नई प्रकार की बिना पहचान वाली व्यापारिक सेवाओं को दर्शाता है: केवल एक सर्वर, कुछ एंडपॉइंट्स, और प्रत्येक कॉल की कीमत। कोई फ्रंटएंड इंटरफ़ेस नहीं है, और कोई बिक्री टीम नहीं है।

इसे प्राप्त करने के लिए भुगतान पथ लाइव हो चुके हैं। Coinbase के x402 और MPP अलग-अलग तरीकों का उपयोग करते हैं, लेकिन दोनों भुगतान को सीधे HTTP अनुरोध में एम्बेड करते हैं। Visa भी समान दिशा में कार्ड भुगतान पथ का विस्तार कर रहा है, जो एक CLI उपकरण प्रदान करता है जिससे डेवलपर्स टर्मिनल से खर्च कर सकते हैं, और व्यापारी पीछे की ओर तुरंत स्थिर मुद्रा प्राप्त करते हैं।

अभी डेटा शुरुआती चरण में है। ब्रशिंग जैसी अनाधिकृत गतिविधियों को हटाने के बाद, x402 प्रति महीने लगभग 1.6 मिलियन डॉलर के एजेंट-संचालित भुगतानों को संभालता है, जो ब्लूमबर्ग द्वारा हाल ही में रिपोर्ट किए गए 24 मिलियन डॉलर (x402.org डेटा का संदर्भ) से काफी कम है। हालाँकि, संबंधित बुनियादी ढांचा तेजी से विस्तारित हो रहा है: Stripe, Cloudflare, Vercel और Google ने सभी x402 को अपने प्लेटफॉर्म में एकीकृत कर लिया है।

डेवलपर टूल्स एक बड़ा अवसर है, जहाँ "vibe coding" के कारण सॉफ्टवेयर बनाने में सक्षम लोगों की संख्या बढ़ रही है, और डेवलपर टूल्स का कुल सम्पूर्ण बाजार भी बढ़ रहा है। Merit Systems जैसी कंपनियाँ इस दुनिया के लिए उत्पाद बना रही हैं, जैसे AgentCash—एक CLI वॉलेट और मार्केट जो MPP और x402 को जोड़ता है। ये उत्पाद Agent को एकल बैलेंस से स्थिर मुद्रा का उपयोग करके आवश्यक डेटा, टूल्स और क्षमताएँ खरीदने की अनुमति देते हैं। उदाहरण के लिए, सेल्स टीम का Agent एक एंडपॉइंट को कॉल कर सकता है और Apollo, Google Maps और Whitepages से डेटा प्राप्त करके संभावित ग्राहकों की जानकारी को समृद्ध कर सकता है, जबकि उपयोगकर्ता को कमांड लाइन से बाहर जाने की आवश्यकता नहीं होती।

ऐसे एजेंट-टू-एजेंट व्यापार आमतौर पर क्रिप्टो भुगतान मार्गों (और उभरती हुई कार्ड-आधारित समाधानों) का उपयोग करते हैं, कुछ कारणों से। पहला बीमा जोखिम है: पारंपरिक भुगतान प्रोसेसर व्यापारी के जोखिम को स्वीकार करते हैं, जबकि एक बिना वेबसाइट या कानूनी संस्था वाला हेडलेस व्यापारी को पारंपरिक प्रोसेसर बीमा नहीं कर सकते। दूसरा, स्थिर मुद्राएँ खुले नेटवर्क पर अनुमति-रहित प्रोग्रामेबलता प्रदान करती हैं: कोई भी डेवलपर किसी भुगतान प्रोसेसर से जुड़े या व्यापारी समझौते पर हस्ताक्षर किए बिना किसी एंडपॉइंट को भुगतान समर्थन दे सकता है।

हमने पहले इस पैटर्न को देखा है। हर व्यापारिक रूपांतरण के साथ, ऐसे नए व्यापारी उत्पन्न होते हैं जिनकी सेवा मौजूदा प्रणालियाँ शुरुआत में करने में असमर्थ रहती हैं। इस बुनियादी ढांचे का निर्माण कर रही कंपनियाँ, मासिक 1.6 मिलियन डॉलर पर नहीं, बल्कि उस समय की भविष्यवाणी कर रही हैं जब Agent डिफ़ॉल्ट खरीददार बन जाएगा।

एजेंट अर्थव्यवस्था में विश्वास को पुनः मूल्यांकित करना

KYA

पिछले 30 लाख वर्षों में, मानव ज्ञान समग्र प्रगति की सीमा रहा है। आज, AI निष्पादन की सीमांत लागत को शून्य की ओर धकेल रहा है। जब दुर्लभ संसाधन प्रचुर हो जाते हैं, तो सीमाएँ स्थानांतरित हो जाती हैं। जब बुद्धिमत्ता सस्ती हो जाती है, तो क्या महंगा हो जाता है? उत्तर है: पुष्टि।

एजेंट अर्थव्यवस्था में, पैमाने की वास्तविक सीमा हमारी मानवीय जैविक सीमाएँ हैं, जो ऑडिट और एजेंट निर्णयों को बीमा देने की क्षमता को प्रभावित करती हैं। एजेंट्स की थ्रूपुट पहले से ही मानवीय निगरानी की क्षमता से बहुत आगे निकल चुकी है। चूंकि निगरानी की लागत अधिक है और विफलताएँ देर से प्रकट होती हैं, बाजार निगरानी में कम निवेश करने की ओर झुकता है। "मानव चक्र में" शीघ्र ही भौतिक रूप से असंभव हो रहा है।

लेकिन अप्रमाणित एजेंट के डिप्लॉय करने से जटिल जोखिम उत्पन्न होते हैं। सिस्टम 'एजेंट' मेट्रिक्स को निर्ममता से अनुकूलित करेगा, जबकि मानवीय इरादों से चुपचाप विचलित होता रहेगा, जिससे विशाल AI ऋण के संचय को छिपाने के लिए खोखली उत्पादकता का भ्रम पैदा होगा। मशीनों को आर्थिक भरोसा देने के लिए, भरोसा मानवीय जांच पर निर्भर नहीं रह सकता—भरोसा को सिस्टम आर्किटेक्चर में ही हार्डकोड किया जाना चाहिए।

जब कोई भी व्यक्ति मुफ्त में सामग्री उत्पन्न कर सकता है, तो सबसे महत्वपूर्ण बात जांचने योग्य स्रोत है—जानना कि यह कहाँ से आया है और क्या आप इस पर भरोसा कर सकते हैं। ब्लॉकचेन, ऑन-चेन प्रमाण और डिसेंट्रलाइज्ड डिजिटल आइडेंटिटी सिस्टम, इस बात की आर्थिक सीमा को बदल रहे हैं कि क्या सुरक्षित रूप से स्थापित किया जा सकता है। आप AI को एक काला बॉक्स नहीं मानते, बल्कि स्पष्ट, ऑडिट करने योग्य इतिहास प्राप्त करते हैं।

जब अधिक AI एजेंट आपस में व्यापार करना शुरू करते हैं, तो सेटलमेंट ट्रैक और स्रोत प्रमाण एक साथ घुलने लगते हैं। धन को संभालने वाले प्रणालियाँ (जैसे स्थिर मुद्रा और स्मार्ट कॉन्ट्रैक्ट) क्रिप्टोग्राफिक प्रमाण भी वहन कर सकती हैं, जो दर्शाते हैं कि किसने क्या किया और अगर कोई समस्या उत्पन्न होती है तो किसे जिम्मेदार ठहराया जाए।

मानवीय तुलनात्मक लाभ ऊपर की ओर स्थानांतरित होगा: छोटी त्रुटियों की खोज से बदलकर रणनीतिक दिशा निर्धारित करने और जब कुछ गलत हो जाए तो जिम्मेदारी लेने की ओर। स्थायी लाभ उन्हीं के पास होगा जो अपने आउटपुट को क्रिप्टोग्राफिक रूप से प्रमाणित कर सकें, उसके लिए बीमा प्रदान कर सकें, और विफलता पर जिम्मेदारी स्वीकार कर सकें।

बिना सत्यापन के मापन एक ऐसा दायित्व है जो समय के साथ जमा हो जाता है।

उपयोगकर्ता नियंत्रण को बनाए रखें

KYA

दशकों से, नए अमूर्त स्तरों ने उपयोगकर्ताओं और प्रौद्योगिकी के बीच बातचीत को परिभाषित किया है। प्रोग्रामिंग भाषाओं ने मशीन कोड को अमूर्त कर दिया; कमांड लाइन का स्थान ग्राफिकल यूजर इंटरफेस ने ले लिया, जिसके बाद मोबाइल ऐप्स और API आए। हर बदलाव ने अधिक निचले स्तर की जटिलता को छुपा दिया, लेकिन हमेशा उपयोगकर्ता को सर्किट में मजबूती से रखा।

एजेंट वर्ल्ड में, उपयोगकर्ता परिणाम निर्दिष्ट करते हैं, न कि विशिष्ट कार्रवाइयाँ, और सिस्टम स्वयं इसे कैसे प्राप्त करे इसका निर्णय लेता है। एजेंट केवल कार्य के निष्पादन के तरीके को ही नहीं, बल्कि इसे कौन निष्पादित करे इसे भी अमूर्त करता है। उपयोगकर्ता प्रारंभिक पैरामीटर सेट करता है, फिर एक कदम पीछे हट जाता है और सिस्टम को स्वयं चलने की अनुमति देता है। उपयोगकर्ता की भूमिका इंटरैक्शन से निगरानी में बदल जाती है; जब तक उपयोगकर्ता हस्तक्षेप नहीं करता, तब तक डिफ़ॉल्ट स्थिति 'ऑन' होती है।

जब उपयोगकर्ता अधिक कार्यों को एजेंट को सौंपते हैं, तो नए जोखिम उत्पन्न होते हैं: अस्पष्ट इनपुट के कारण एजेंट उपयोगकर्ता की अनुमति के बिना गलत धारणाओं पर कार्य कर सकता है; विफलताएँ रिपोर्ट नहीं हो सकतीं, जिससे स्पष्ट निदान संभव नहीं होता; एक ही स्वीकृति से कोई भी अप्रत्याशित बहु-चरणीय प्रवाह ट्रिगर हो सकता है।

यही वह जगह है जहाँ क्रिप्टोग्राफी मदद कर सकती है। क्रिप्टोग्राफी हमेशा से अंधे विश्वास को कम करने पर ध्यान केंद्रित रही है। जैसे-जैसे उपयोगकर्ता अधिक निर्णय सॉफ्टवेयर को सौंपते जा रहे हैं, एजेंट सिस्टम इस समस्या को और अधिक तीव्र बना रहे हैं और हमारे डिज़ाइन के दौरान सख्ती की मांग बढ़ा रहे हैं—अधिक स्पष्ट सीमाएँ निर्धारित करके, दृश्यता में सुधार करके, और सिस्टम क्षमताओं के बारे में मजबूत गारंटीयों को लागू करके।

नए पीढ़ी के क्रिप्टो-नेटिव टूल्स उभर रहे हैं। स्कोप डेलिगेशन फ्रेमवर्क—जैसे MetaMask का Delegation Toolkit, Coinbase का AgentKit और Agent वॉलेट, और Merit Systems का AgentCash—उपयोगकर्ताओं को स्मार्ट कॉन्ट्रैक्ट स्तर पर यह परिभाषित करने की अनुमति देते हैं कि Agent क्या कर सकता है और क्या नहीं। इंटेंट-आधारित आर्किटेक्चर (जैसे NEAR Intents, जो 2024 की चौथी तिमाही से लेकर 15 बिलियन डॉलर से अधिक की कुल DEX ट्रेडिंग वॉल्यूम को प्रोसेस कर चुका है)—उपयोगकर्ताओं को केवल अपना इच्छित परिणाम (जैसे “टोकन ब्रिज करें और स्टेक करें”) सेट करने की अनुमति देता है, बिना इसके कि वे इसे कैसे प्राप्त करेंगे, यह निर्दिष्ट करें।