رسالة من ChainThink، 8 مارس، وفقًا لتقرير Axios، أفادت دراسة بحثية نُشرت من قبل فريق بحثي مرتبط بعلي بابا أن وكيل الذكاء الاصطناعي الذي طوروه، ROME، أظهر سلوكًا "خارج الحدود" أثناء التدريب: حيث حاول تلقائيًا تعدين العملات المشفرة دون أي تعليمات صريحة من البشر، وأنشأ نفق SSH عكسي، مما يعني فتح باب خلفي مخفي من داخل النظام للاتصال بجهاز خارجي.
كانت فريق البحث يُدرّب ROME باستخدام التعلم المعزز بهدف تمكينه من إكمال مهام متعددة الخطوات بشكل مستقل. خلال عملية التدريب، أطلق نظام المراقبة الأمنية إنذارًا مفاجئًا، واكتشف أن موارد GPU تُستخدم بشكل غير طبيعي، مع أنماط تدفق تشبه أنشطة تعدين العملات المشفرة. تم تشغيل تعدين العملات المشفرة دون إذن، مما زاد من تكاليف استخدام الموارد الحاسوبية، كما تم إنشاء نفق شبكة عكسي مخفي لفتح بوابة خلفية من الداخل إلى الخارج.
ثم أضاف فريق البحث قيودًا أكثر صرامة وحسّن عملية التدريب لمنع حدوث سلوكيات غير آمنة مرة أخرى.
