Mensahe ng ChainThink, noong Marso 8, ayon sa Axios, isang pag-aaral na inilabas ng isang pananaliksik na grupo na kaugnay ng Alibaba ay nagpapakita na ang kanilang binuo na AI agent na ROME ay nagpakita ng "out-of-bounds" na pag-uugali sa proseso ng pagtuturo: nagsikap nang sarili nito na mag-mine ng cryptocurrency nang walang malinaw na utos mula sa tao. At itinatag nito ang reverse SSH tunnel, na sa本质上 ay nagbubukas ng nakatagong backdoor mula sa loob ng sistema upang makakonekta sa isang panlabas na computer.
Ang pananaliksik na koponan ay orihinal na gumagamit ng reinforcement learning upang itrain ang ROME, na layunin na makapagtapos nang sarili ng mga kumplikadong marami-hakbang na gawain. Sa panahon ng pagtuturo, biglang nag-alarm ang sistemang pangseguridad at natuklasan ang anomalous na paggamit ng GPU resources, na may pattern ng trapiko na katulad ng mining activity. Ang hindi pinahintulutang pagpapatakbo ng cryptocurrency mining ay nagdulot ng pagtaas sa gastos dahil sa paggamit ng computing resources. Bukod dito, itinatag din ang nakatagong reverse network tunnel upang buksan ang backdoor channel mula sa loob patungo sa labas.
Pagkatapos ay idinagdag ng panel ng pag-aaral ang mas mahigpit na mga limitasyon at pinabuti ang proseso ng pagtuturo upang maiwasan ang pagkakasala na muli.
