جب کسی ریڈ ٹیمر کو Anthropic کے نئے مدل پر اس کے ویب براوز کرتے ہوئے مسلط کیا جائے، تو حملہ آور تقریباً تین میں سے ایک بار اسے کنٹرول کر لیتا ہے۔ یہ اصل آمار ہے: کلاؤڈ آپس 4.8 کے براؤزر ایجینٹ کے لیے دفاعی تحفظات فعال ہونے سے پہلے پرامپٹ انجیکشن کی کامیابی کی شرح 31.5% ہے۔
لیبز کے درمیان شفافیت کا فرق
اینٹروپک نے 28 مئی کو 244 صفحات پر مشتمل ایک سیفٹی رپورٹ جاری کی، جس میں چار الگ ایجنٹ سطحیں شامل ہیں: ویب پر براؤز کرنا، کوڈ لکھنا، دوسرے AI ایجنٹس کے ساتھ کوآرڈینیٹ کرنا، اور باہری ٹولز کے ساتھ تعامل کرنا۔
اوپن اے آئی نے صرف ایک سطح پر رپورٹ کی: کنکٹرز۔ گوگل نے پورا موضوع اپنے ماڈل کارڈ سے نکال کر الگ سیفٹی فریم ورک دستاویز میں منتقل کر دیا۔ میٹا نے بالکل بند ماڈل کارڈ شپ نہیں کیا۔
31.5% کا عدد محفوظہ اقدامات سے پہلے کا ہے، جس کا مطلب ہے کہ یہ اینٹھروپک کے دفاعی لیئرز کے شروع ہونے سے پہلے ماڈل کی خام کمزوری کو ظاہر کرتا ہے۔ ہر پروڈکشن ڈیپلویمنٹ میں گارڈریلز، مانیٹرنگ اور فلٹرنگ شامل ہوتی ہے جو حقیقی دنیا میں استعمال کی شرح کو کم کرتی ہیں۔ لیکن بنیادی کمزوری کو جاننا وہی ڈیٹا ہے جس کی سیکورٹی آرکیٹیکٹس کو ان گارڈریلز کو درست طریقے سے تعمیر کرنے کے لیے ضرورت ہوتی ہے۔
اپس 4.8 دراصل کیا مختلف کرتا ہے
کوڈنگ کی غلطیوں پر جھوٹے منفی نتائج، جہاں ماڈل اپنی غلطیوں کو نہیں پکڑ پاتا، 19.7% سے گھٹ کر 3.7% ہو گئے۔ Opus 4.8 میں بڑے سافٹ ویئر منصوبوں کو منظم کرنے کے لیے ساتھ میں سینکڑوں ذیلی ایجنٹس کو ہدایت کرنے والا ڈائنانمک متعدد ایجنٹ انتظام بھی شامل ہے۔
کرپٹو کیوں توجہ دے
براؤزر-بنیادی ایجینٹس کے لیے 31.5% کی پری-سیفگارڈ ہجوم کی شرح کسی بھی کریپٹو میں AI سسٹم چلانے والے کو روک دینی چاہیے۔ براؤزر ایجینٹس بالکل وہی قسم کے ٹولز ہیں جن کا استعمال کریپٹو پروجیکٹس ڈیش بورڈز کی نگرانی، آن-چین ڈیٹا کو اسکریپ کرنے، ڈی ایکس فرینٹ اینڈز کے ساتھ تعامل کرنے، اور ویب انٹرفیسز کے ذریعے ٹریڈز کو انجام دینے کے لیے کرتے ہیں۔
براؤزر ایجینٹ میں پرومپٹ انجیکشن کا مطلب ہے کہ ایک بری بھری ویب سائٹ، ایک مجبور API ریسپانس، یا حتیٰ کہ ایک چالاکانہ تیار کیا گیا ٹوکن نام AI ایجینٹ کے رویے کو منحرف کر سکتا ہے۔ روایتی سافٹ ویئر میں، یہ ڈیٹا بریچ ہے۔ کرپٹو میں، یہ خالی والٹ ہے۔
متعدد ایجینٹ اورکیسٹریشن ایک اور درجہِ پیچیدگی شامل کرتا ہے۔ جب Opus 4.8 سوویں ذیلی ایجینٹس کو کوآرڈینیٹ کرتا ہے، تو ایک واحد کامیاب پرامپٹ انجیکشن پورے ورک فلو پر کیسکیڈ ہو سکتا ہے۔ کرپٹو کے حوالے سے، یہ ایک م compromising ٹرانزیکشن اور ایک پورے آٹومیٹڈ ٹریڈنگ آپریشن میں نظام گٹر کے درمیان فرق ہے۔
