دراسة تُظهر أن وكلاء الذكاء الاصطناعي لا يزالون عرضة لهجمات حقن الأوامر

موقع CoinNews يُفيد:

مع تسارع تطبيق الوكلاء الذكاء الاصطناعي القادرة على الاتصال بالإنترنت بشكل مستقل، واسترجاع المعلومات، والتسوق، وحتى تنفيذ معاملات التشفير، تُظهر دراسة حديثة أن هذه الأنظمة لا تزال تفتقر إلى حماية مستقرة ضد هجمات حقن التوجيه.

أُجريت الدراسة من قبل فرق من جامعة نانيانغ التكنولوجية وST Engineering وIBM Research وجامعة إيلينوي إيربانا-شامبين. وأفاد الباحثون أنه في عينات الاختبار، لم يكن أي من وكلاء الذكاء الاصطناعي قادرًا على الصمود باستمرار أمام هذا النوع من الهجمات.

نجاح الهجوم المباشر يتجاوز 79%

يُشير حقن التلميح إلى قيام المهاجم بإدخال تعليمات مخفية داخل صفحة ويب أو نص أو محتوى خارجي آخر، بهدف إقناع الوكيل الذكي بالابتعاد عن الهدف الأصلي للمستخدم والقيام بإجراءات يحددها المهاجم.

لتقريب الظروف من البيئة الحقيقية، طوّر فريق البحث معيار اختبار يُسمى StakeBench لتقييم أداء الوكلاء الذكاء الاصطناعي تحت الهجمات في المهام عبر الإنترنت. شمل الاختبار إطاري عمل NanoBrowser وBrowserUse، ودمج بين GPT-5 وGemini 2.5-Flash في 3,168 محاكاة هجوم.

يشمل إطار العمل NanoBrowser و BrowserUse
تشمل نماذج الاختبار GPT-5 و Gemini 2.5-Flash
نجاح الهجوم المباشر يتجاوز 79% في جميع التكوينات

لا تزال الأوامر المخفية على الصفحة فعالة

أظهرت نتائج الدراسة أن نسبة نجاح الهجمات غير المباشرة المُدمجة في محتوى الويب تتراوح بين 41.67% و68.16%. هذه الهجمات أقرب إلى سيناريوهات النشر الواقعية، حيث لا يحتاج المهاجمون إلى التفاعل المباشر مع مدخلات المستخدم، بل يكفي إخفاء الأوامر داخل محتوى الويب للتأثير على قرارات الوكيل اللاحقة.

ركّز الفريق على ثلاثة عوامل: المسافة الدلالية بين الهدف المُحقَن ومهمة المستخدم، ما إذا كانت إشارات البيئة المحيطة متسقة، وما المرحلة من عملية التنفيذ التي يُكتشف فيها المحتوى الضار لأول مرة. ويعتقد البحث أن هذه العوامل تؤثر جميعها على نجاح الهجوم.

كانت شركات التكنولوجيا قد حذرت عدة مرات سابقًا

قبل نشر هذه الدراسة، تم ذكر المخاطر ذات الصلة عدة مرات من قبل شركات التكنولوجيا الكبرى. فقد حذّر باحثو مايكروسوفت في فبراير من هذا العام من أن الأوامر المخفية في روابط ملخصات الذكاء الاصطناعي قد تؤثر على سلوك الروبوتات المحادثة. كما سجّلت جوجل في أبريل أمثلة على حقن التلميحات المخبأة في صفحات الويب، حيث تهدف الهجمات ذات الصلة إلى تحفيز وكلاء الذكاء الاصطناعي على كشف بيانات الاعتماد أو تنفيذ مدفوعات.

كما كشفت مايكروسوفت لاحقًا عن وجود عيب في حقن التلميحات في إجراء GitHub الخاص بـ Anthropic's Claude Code، مما قد يؤدي إلى كشف بيانات اعتماد المستخدم.

كما أشار البحث إلى حالة تُعرف باسم "التطفل الخفي"، حيث يُكمل الوكيل المهمة التي يطلبها المستخدم ظاهريًا، لكنه في الوقت نفسه يُقدّم أهداف المهاجم سرًا. على سبيل المثال، في سيناريو توصية المنتجات، قد يُقدّم النظام اقتراحات تبدو طبيعية، لكنه يُوجه المستخدم سرًا نحو منتجات محددة.