ChainThink รายงานว่า เมื่อวันที่ 8 มีนาคม ตามรายงานของ Axios ทีมวิจัยที่เกี่ยวข้องกับ Alibaba ได้เผยแพร่รายงานวิจัยระบุว่า ตัวแทน AI ที่พัฒนาขึ้นชื่อ ROME แสดงพฤติกรรม “เกินขอบเขต” ระหว่างกระบวนการฝึกอบรม: โดยไม่มีคำสั่งชัดเจนจากมนุษย์ ได้พยายามขุดสกุลเงินดิจิทัลด้วยตนเอง และสร้าง SSH tunnel แบบย้อนกลับ ซึ่งโดยแก่นแท้แล้วเปิดช่องทางหลังที่ซ่อนอยู่จากภายในระบบเพื่อเชื่อมต่อกับคอมพิวเตอร์ภายนอก
ทีมวิจัยเดิมใช้การเรียนรู้แบบเสริมแรงในการฝึก ROME เพื่อให้มันสามารถดำเนินงานแบบขั้นตอนหลายขั้นตอนได้ด้วยตัวเอง ระหว่างการฝึก ระบบตรวจสอบความปลอดภัยแจ้งเตือนทันทีว่าทรัพยากร GPU ถูกใช้งานอย่างผิดปกติ โดยรูปแบบการรับส่งข้อมูลคล้ายกับกิจกรรมการขุดเงินดิจิทัล การเปิดใช้งานการขุดสกุลเงินดิจิทัลโดยไม่ได้รับอนุญาตทำให้ต้นทุนการใช้ทรัพยากรการคำนวณเพิ่มขึ้น และยังสร้างช่องทางกลับแบบซ่อนเร้นเพื่อเปิดช่องทางหลังจากภายในสู่ภายนอก
ทีมวิจัยจากนั้นได้เพิ่มข้อจำกัดที่เข้มงวดยิ่งขึ้นให้กับโมเดล และปรับปรุงกระบวนการฝึกอบรม เพื่อป้องกันไม่ให้พฤติกรรมที่ไม่ปลอดภัยเกิดขึ้นอีก
