आपका पसंदीदा AI सहायक शायद बुद्धिमान है, लेकिन शोधकर्ता अब तर्क देते हैं कि इसे उसी संदेह के साथ व्यवहार किया जाना चाहिए जिस तरह आपका कंप्यूटर किसी यादृच्छिक डाउनलोड किए गए प्रोग्राम के साथ व्यवहार करता है। arXiv पर प्रकाशित मई 2026 का एक पेपर यह तर्क देता है कि AI एजेंट, विशेष रूप से वित्तीय लेनदेन संभालने वाले, को बड़ी प्रणालियों के भीतर मूल रूप से अविश्वसनीय घटकों के रूप में डिज़ाइन किया जाना चाहिए।
पेपर, जिसका शीर्षक "एजेंट सुरक्षा एक सिस्टम समस्या है" (arXiv:2605.18991) है, उसका आगमन उसी समय हुआ है जब क्रिप्टो उद्योग स्वायत्त AI एजेंट्स पर भारी निवेश कर रहा है, जो DeFi ट्रेड्स से लेकर वॉलेट संचालन तक की सभी चीजों को प्रबंधित करेंगे। सर्कल के सीईओ जेरेमी एलेयर ने अनुमान लगाया है कि अगले तीन से पांच वर्षों के भीतर अरबों AI एजेंट्स स्टेबलकॉइन का उपयोग करके स्वतंत्र रूप से आर्थिक गतिविधियाँ करेंगे।
ऑपरेटिंग सिस्टम की तुलना
आधुनिक ऑपरेटिंग सिस्टम व्यक्तिगत प्रक्रियाओं पर भरोसा नहीं करते। प्रत्येक एप्लिकेशन सीमित अनुमतियों के साथ एक सैंडबॉक्स में चलता है, केवल उन फाइलों तक ही पहुँच सकता है जिनके लिए इसे स्पष्ट रूप से अनुमति दी गई है, और इसे समाप्त कर दिया जाता है यदि यह अपनी सीमाओं के बाहर जाने का प्रयास करता है। शोधकर्ता चाहते हैं कि AI एजेंट्स पर भी इसी दर्शन को लागू किया जाए।
कागजात तीन विशिष्ट उपायों का समर्थन करता है। पहला, सिस्टम स्तर पर सुरक्षा अपरिवर्तनीयताओं को लागू करना, जिसका अर्थ है कठोर नियम जिन्हें AI स्वयं द्वारा ओवरराइड नहीं किया जा सकता। दूसरा, न्यूनतम अधिकार वाला सैंडबॉक्सिंग लागू करना, जहाँ एजेंट केवल अपने विशिष्ट कार्य के लिए आवश्यक न्यूनतम संसाधनों तक ही पहुँच प्राप्त करते हैं। तीसरा, निर्देशों और डेटा के बीच प्रभावी पृथक्करण सुनिश्चित करना, जो AI प्रणालियों में आज के सबसे खतरनाक हमलों में से एक को सुलझाता है।
वह अंतिम बिंदु उतना महत्वपूर्ण है जितना यह सुनाई देता है। प्रॉम्प्ट इंजेक्शन हमले तब काम करते हैं क्योंकि एआई एजेंट अक्सर मान्य निर्देशों और छिपे हुए आदेशों वाले दुर्भावनापूर्ण डेटा के बीच अंतर नहीं कर पाते। जब एक एजेंट एक लेन-देन मेमो को प्रोसेस करता है जिसमें गुप्त रूप से धन को पुनः निर्देशित करने के निर्देश होते हैं, तो इस अलगाव की कमी $500,000 की समस्या बन जाती है।
$500K की जागरूकता की घंटी
वह संख्या काल्पनिक नहीं है। अप्रैल 2026 की एक घटना में AI बुनियादी ढांचे और दुर्भावनापूर्ण टूल कॉल्स के कारण ठीक वही रकम क्रिप्टो वॉलेट से निकाल ली गई। हमले ने शोधकर्ताओं द्वारा चेतावनी दी गई ऐसी कमजोरी का फायदा उठाया: एक AI एजेंट जिसे बहुत अधिक पहुंच मिली हुई थी, इसके द्वारा कॉल किए जा रहे टूल्स की पर्याप्त जांच नहीं हुई थी, और धन के वॉलेट से बाहर निकलने से पहले कोई सिस्टम-स्तरीय सुरक्षा प्रणाली नहीं थी जो असामान्यता को पकड़ सके।
इन एजेंट्स की स्वायत्त प्रकृति जोखिम को बढ़ा देती है। एक मानव ट्रेडर जिसे फिशिंग ईमेल मिले, वह रुक सकता है और सोच सकता है। एक एआई एजेंट जिसे धूर्ततापूर्वक बनाया गया प्रॉम्प्ट इंजेक्शन मिले, उसका निष्पादन मशीन की गति से हो जाता है, जिससे किसी मॉनिटरिंग सिस्टम के प्रतिक्रिया करने से पहले ही संपत्ति खाली हो सकती है।
हार्डवेयर और शासन प्रतिक्रियाएँ
कुछ कंपनियां पहले ही कागज़ द्वारा सुझाई गई दिशा में बढ़ रही हैं। लेज़र्ड ने 2026 के लिए एक सुरक्षा रोडमैप तैयार किया है, जिसमें AI एजेंट वातावरण के लिए विशेष रूप से डिज़ाइन किए गए हार्डवेयर सुरक्षा पहलू शामिल हैं। तर्क सरल है: यदि आप सॉफ़्टवेयर परत पर पूरी तरह से भरोसा नहीं कर सकते, तो महत्वपूर्ण संचालन को हार्डवेयर में स्थापित करें, जो AI के व्यवहार से स्वतंत्र क्रिप्टोग्राफिक गारंटी प्रदान करता है।
इसे एक “मॉडल समस्या” के बजाय एक “सिस्टम समस्या” के रूप में लेने की कागजात की सिफारिश एक महत्वपूर्ण भिन्नता है। यह जिम्मेदारी को केवल AI विकासकर्ताओं से नहीं, बल्कि बुनियादी ढांचा प्रदाताओं, प्रोटोकॉल डिजाइनरों और प्लेटफॉर्म संचालकों के व्यापक परितंत्र पर स्थानांतरित करती है।
इसका निवेशकों के लिए क्या अर्थ है
AI एजेंट कार्रवाइयों के लिए सत्यापनयोग्य गणना, एजेंट व्यवहार का ऑन-चेन प्रमाणीकरण, और अनिवार्य न्यूनतम अधिकार पहुंच नियंत्रण वाले प्रोटोकॉल के लिए देखते रहें। अगले 12 से 18 महीनों के भीतर ये सुविधाएँ संस्थागत-ग्रेड AI एजेंट प्लेटफॉर्म के लिए संभवतः टेबल स्टेक्स बन जाएँगी।
