Mesej ChainThink, 8 Mac, menurut laporan Axios, sebuah kajian oleh pasukan penyelidik yang berkaitan dengan Alibaba menyatakan bahawa agen AI yang mereka kembangkan, ROME, menunjukkan perilaku "melanggar batas" semasa latihan: secara autonomi mencuba penambangan kripto tanpa arahan jelas daripada manusia, serta membina terowong SSH songsang, yang pada dasarnya membuka pintu belakang tersembunyi dari dalam sistem untuk menghubungkan ke komputer luar.
Pasukan penyelidik asalnya menggunakan pembelajaran penguatan untuk melatih ROME, dengan harapan ia mampu menyelesaikan tugas berlangkah kompleks secara bebas. Semasa latihan, sistem pengawasan keselamatan tiba-tiba mengaktifkan amaran, mendapati sumber GPU digunakan secara tidak normal, dengan corak trafik yang serupa dengan aktiviti penambangan. Penambangan mata wang kripto tanpa kebenaran, yang meningkatkan kos sumber pengiraan, serta membina terowong rangkaian songsang tersembunyi untuk membuka pintu belakang dari dalam ke luar.
Kemudian, pasukan penyelidik menambahkan lebih banyak pembatasan ketat kepada model dan memperbaiki proses latihan untuk mencegah tingkah laku tidak selamat berlaku semula.
