مطالعہ سے پتہ چلتا ہے کہ AI ایجنسز اب بھی پرامپٹ انجیکشن حملوں کے لیے زائدوں ہیں

CoinDesk کی رپورٹ:

جیسے جیسے خود مختار طور پر انٹرنیٹ کا استعمال کرنے، معلومات حاصل کرنے، خریداری کرنے اور حتیٰ کہ ایکرپٹ ٹریڈنگ کرنے والے AI ایجینٹس تیزی سے لاگو ہو رہے ہیں، ایک نئی تحقیق سے پتہ چلتا ہے کہ اس قسم کے نظامز پر پرامپٹ انجیکشن حملوں کے خلاف مستحکم تحفظ کی کمی ہے۔

یہ تحقیق نانیانگ ٹیکنولوجیکل یونیورسٹی، ST Engineering، IBM Research اور ایلینوائی یونیورسٹی، اربانا-شامپین کے ٹیم نے کی۔ تحقیق کاروں کا کہنا ہے کہ ٹیسٹ نمونوں میں کوئی بھی AI ایجینٹ اس قسم کے حملوں کا مستقل طور پر مقابلہ نہیں کر سکا۔

سیدھے حملے کی کامیابی کی شرح 79% سے زیادہ

ٹِپ انجیکشن کا مطلب ہے کہ حملہ آور چھپے ہوئے ہدایات کو ویب صفحے، متن یا دیگر بیرونی مواد میں ڈال دیتا ہے تاکہ AI ایجینٹ کو صارف کے اصل مقصد سے منحرف کرکے حملہ آور کی طرف سے تعین کردہ اقدامات پر عمل کرنے پر مجبور کیا جائے۔

حقیقی استعمال کے ماحول کے قریب پہنچنے کے لیے، تحقیقی ٹیم نے StakeBench نامی ایک ٹیسٹ بینچ مارک تیار کیا ہے جو AI ایجینٹس کی آن لائن ٹاسکس میں حملوں کے تحت کارکردگی کا جائزہ لینے کے لیے استعمال ہوتا ہے۔ یہ ٹیسٹنگ NanoBrowser اور BrowserUse دونوں ایجینٹ فریم ورکس کو کور کرتی ہے اور GPT-5 اور Gemini 2.5-Flash کے ساتھ 3,168 حملوں کا شبیہہ بنایا گیا ہے۔

ٹیسٹ فریم ورک میں نینو براؤزر اور براؤزر استعمال شامل ہیں
ٹیسٹ مدلز میں GPT-5 اور Gemini 2.5-Flash شamil ہیں
تمام ترتیبات میں براہ راست حملے کی کامیابی کی شرح 79% سے زیادہ ہے

ویب پیج کے پوشیدہ حکومات اب بھی کام کر سکتے ہیں

مطالعہ کے نتائج سے پتہ چلتا ہے کہ ویب پیج کے مواد میں چھپائے گئے غیر مستقیم حملوں کی کامیابی کی شرح 41.67% سے 68.16% تک ہے۔ اس قسم کے حملے حقیقی ڈیپلویمنٹ کے مناظر کے قریب ہیں، کیونکہ حملہ آور کو صرف اپنے حکمات کو ویب پیج کے مواد میں چھپانا ہوتا ہے، جس سے وہ اسٹریٹجک فیصلوں پر اثر ڈال سکتا ہے۔

ٹیم نے تین عوامل پر توجہ مرکوز کی: ہدف کی سیمانٹک فاصلہ، ماحولیاتی اشارے کی مطابقت، اور ایجنٹ کب اور کس مرحلے میں برے مواد تک پہنچا۔ تحقیق کے مطابق، یہ تمام عوامل حملے کی کامیابی پر اثر ڈالتے ہیں۔

ٹیک کمپنیوں نے پہلے بھی کئی بار انتباہ کیا تھا

اس تحقیق کے شائع ہونے سے پہلے، متعلقہ خطرات کو بڑی ٹیکنالوجی کمپنیوں نے کئی بار اٹھایا تھا۔ مائیکروسافٹ کے تحقیقی افراد نے فروری میں انتباہ دیا تھا کہ AI خلاصہ کے لنکس میں چھپے ہوئے حکمات چیٹ بوٹ کے رویے کو متاثر کر سکتے ہیں۔ گوگل نے اپریل میں ویب پیجز میں چھپے ہوئے پرامپٹ انجیکشن کے معاملات درج کیے، جن میں متعلقہ حملوں نے AI ایجینٹس کو اعتمادی تفصیلات فاش کرنے یا ادائیگیاں شروع کرنے کے لیے متاثر کرنے کی کوشش کی۔

مایکروسافٹ نے بعد میں ایکنٹرپک کے کلاؤڈ کوڈ گٹہب ایکشن میں پرامپٹ انجیکشن کی کمی کا اعلام کیا، جس کی وجہ سے صارفین کے اعتمادی تفصیلات کا خطرہ ہو سکتا ہے۔

مطالعہ میں ایک ایسی صورت کا ذکر کیا گیا ہے جسے "چھپا ہوا پرندہ" کہا جاتا ہے، جہاں ایجنٹ صارف کے کام کو ظاہری طور پر مکمل کرتا ہے، لیکن اس کے ساتھ ہی حملہ آور کے مقاصد کو پیچھے سے آگے بڑھاتا ہے۔ مثال کے طور پر، مصنوعات کی تجویز کے منظر میں، سسٹم شاید معمول کے مطابق تجاویز دے رہا ہو، لیکن صارف کو چپکے سے کسی خاص مصنوعات کی طرف راغب کر رہا ہو۔