Asisten AI favorit Anda mungkin cerdas, tetapi para peneliti kini berargumen bahwa seharusnya diperlakukan dengan kecurigaan yang sama seperti yang diberikan komputer Anda terhadap program yang diunduh secara acak. Sebuah makalah Mei 2026 yang diterbitkan di arXiv berargumen bahwa agen AI, terutama yang menangani transaksi keuangan, perlu dirancang sebagai komponen yang secara fundamental tidak dipercaya dalam sistem yang lebih besar.
Makalah berjudul “Agent Security is a Systems Problem” (arXiv:2605.18991) muncul pada saat industri kripto sangat bergantung pada agen AI otonom untuk mengelola segala hal, mulai dari perdagangan DeFi hingga operasi dompet. CEO Circle, Jeremy Allaire, memproyeksikan bahwa miliaran agen AI akan secara mandiri melakukan kegiatan ekonomi menggunakan stablecoin dalam tiga hingga lima tahun ke depan.
Analogi sistem operasi
Sistem operasi modern tidak mempercayai proses individu. Setiap aplikasi berjalan dalam sandbox dengan izin terbatas, hanya dapat mengakses file yang secara eksplisit diberikan, dan akan dihentikan jika mencoba melampaui batasnya. Para peneliti ingin filosofi yang sama diterapkan pada agen AI.
Artikel ini mendukung tiga langkah spesifik. Pertama, menegakkan invariant keamanan pada tingkat sistem, artinya aturan ketat yang tidak dapat diabaikan oleh AI itu sendiri. Kedua, menerapkan sandboxing dengan prinsip hak akses minimum, di mana agen hanya mendapatkan akses ke sumber daya minimum yang diperlukan untuk tugas spesifik mereka. Ketiga, memastikan pemisahan yang efektif antara instruksi dan data, yang menangani salah satu vektor serangan paling berbahaya dalam sistem AI saat ini.
Poin terakhir ini lebih penting daripada yang terdengar. Serangan prompt injection bekerja justru karena agen AI sering tidak dapat membedakan antara instruksi sah dan data jahat yang berisi perintah tersembunyi. Ketika agen memproses memo transaksi yang secara diam-diam berisi instruksi untuk mengalihkan dana, kurangnya pemisahan menjadi masalah senilai $500.000.
Pemacu $500K
Angka itu bukan hipotetis. Insiden pada April 2026 mengakibatkan jumlah tepat itu ditarik dari dompet kripto karena kelemahan dalam infrastruktur AI dan panggilan alat jahat. Serangan tersebut memanfaatkan kerentanan yang diwaspadai oleh para peneliti: agen AI dengan akses terlalu banyak, verifikasi yang tidak memadai terhadap alat yang dipanggilnya, dan tidak ada pengaman tingkat sistem untuk mendeteksi anomali sebelum dana keluar dari dompet.
Sifat otonom dari agen-agen ini memperparah risiko. Seorang trader manusia yang menerima email phishing mungkin akan berhenti dan berpikir. Sebuah agen AI yang menerima injeksi prompt yang dirancang dengan cermat akan menjalankannya dengan kecepatan mesin, berpotensi menguras aset sebelum sistem pemantauan mana pun bisa bereaksi.
Respons perangkat keras dan tata kelola
Beberapa perusahaan sudah bergerak searah dengan rekomendasi makalah tersebut. Ledger telah merancang peta jalan keamanan tahun 2026 yang mencakup inisiatif keamanan perangkat keras yang dirancang khusus untuk lingkungan agen AI. Logikanya sederhana: jika Anda tidak dapat sepenuhnya mempercayai lapisan perangkat lunak, kaitkan operasi kritis pada perangkat keras yang memberikan jaminan kriptografis independen dari perilaku AI.
Rekomendasi dalam makalah untuk memperlakukan ini sebagai masalah "sistem" daripada masalah "model" adalah perbedaan yang bermakna. Hal ini memindahkan tanggung jawab dari para pengembang AI saja ke seluruh ekosistem penyedia infrastruktur, perancang protokol, dan operator platform.
Apa artinya ini bagi para investor
Perhatikan protokol yang menerapkan komputasi yang dapat diverifikasi untuk tindakan agen AI, attestasi perilaku agen di rantai, dan kontrol akses prinsip hak akses minimum yang wajib. Fitur-fitur ini kemungkinan akan menjadi standar dasar untuk platform agen AI tingkat institusional dalam 12 hingga 18 bulan mendatang.
