Pembantu AI kegemaran anda mungkin pintar, tetapi para penyelidik kini berhujah bahawa ia sepatutnya diperlakukan dengan sikap curiga yang sama seperti komputer anda terhadap program yang dimuat turun secara rawak. Sebuah kertas kerja pada Mei 2026 yang diterbitkan di arXiv berhujah bahawa agen AI, terutamanya yang menangani transaksi kewangan, perlu direka sebagai komponen yang secara asasnya tidak dipercayai dalam sistem yang lebih besar.
Kertas kerja yang berjudul “Keselamatan Agen adalah Masalah Sistem” (arXiv:2605.18991) muncul pada masa ketika industri kripto sedang mempertaruhkan banyak sumber daya pada agen AI otonom untuk mengurus segala hal, mulai dari perdagangan DeFi hingga operasi dompet. CEO Circle, Jeremy Allaire, memproyeksikan bahawa miliaran agen AI akan menjalankan aktiviti ekonomi secara berdiri sendiri menggunakan koin stabil dalam tempoh tiga hingga lima tahun ke depan.
Analogi sistem pengendali
Sistem pengendalian moden tidak mempercayai proses individu. Setiap aplikasi berjalan dalam persekitaran terkungkung dengan kebenaran terhad, hanya boleh mengakses fail yang secara eksplisit diberikan, dan akan dihentikan jika cuba melanggar sempadannya. Para penyelidik ingin falsafah yang sama diterapkan kepada agen AI.
Kertas ini menggalakkan tiga langkah khusus. Pertama, memperkasakan invariant keselamatan pada peringkat sistem, bermaksud peraturan ketat yang tidak boleh dilanggar oleh AI itu sendiri. Kedua, melaksanakan sandboxing dengan kuasa minimum, di mana agen hanya mendapat akses kepada sumber minimum yang diperlukan untuk tugas spesifik mereka. Ketiga, memastikan pemisahan yang berkesan antara arahan dan data, yang menangani salah satu vektor serangan paling berbahaya dalam sistem AI hari ini.
Poin terakhir ini lebih penting daripada yang mungkin terdengar. Serangan penyuntikan prompt berjaya kerana agen AI sering tidak mampu membezakan antara arahan sah dan data jahat yang mengandungi arahan tersembunyi. Apabila agen memproses memo transaksi yang secara rahsia mengandungi arahan untuk mengalihkan dana, kekurangan pemisahan menjadi masalah sebanyak $500,000.
Pemanggil bangun $500K
Nombor itu bukan hipotetikal. Kejadian pada April 2026 menyebabkan jumlah tepat itu ditarik daripada dompet kripto akibat kelemahan dalam infrastruktur AI dan panggilan alat jahat. Serangan itu memanfaatkan kelemahan yang diperingatkan oleh penyelidik: agen AI dengan akses terlalu banyak, pengesahan yang tidak mencukupi terhadap alat yang dipanggil, dan tiada sistem pengawal peringkat sistem untuk mengesan anomali sebelum dana keluar daripada dompet.
Sifat autonomus agen-agen ini meningkatkan risiko. Seorang pedagang manusia yang menerima e-mel penipuan mungkin akan berhenti dan berfikir. Sebuah agen AI yang menerima penyuntikan arahan yang dirancang dengan teliti akan melaksanakannya pada kelajuan mesin, berpotensi menguras aset sebelum sistem pemantauan mana pun sempat bertindak.
Tanggapan peranti keras dan tata pentadbiran
Beberapa syarikat sudah bergerak mengikut arah yang dicadangkan dalam kertas ini. Ledger telah menggariskan peta jalan keselamatan 2026 yang merangkumi inisiatif keselamatan peranti keras yang direka khas untuk persekitaran agen AI. Logiknya adalah mudah: jika anda tidak boleh sepenuhnya mempercayai lapisan perisian, tetapkan operasi penting dalam peranti keras yang memberi jaminan kriptografi secara bebas daripada tingkah laku AI.
Cadangan kertas itu untuk memperlakukan ini sebagai “masalah sistem” bukan sebagai “masalah model” adalah perbezaan yang bermakna. Ia mengalihkan tanggungjawab daripada pembangun AI semata-mata kepada ekosistem yang lebih luas yang terdiri daripada penyedia infrastruktur, reka bentuk protokol, dan pengendali platform.
Apa yang ini bermaksud kepada pelabur
Perhatikan protokol yang mengimplementasikan pengiraan yang boleh disahkan untuk tindakan agen AI, sertifikasi perilaku agen di rantai, dan kawalan akses prinsip kuasa paling minimum yang wajib. Ciri-ciri ini kemungkinan besar akan menjadi keperluan asas untuk platform agen AI peringkat institusi dalam tempoh 12 hingga 18 bulan ke depan.
