Ang iyong paboritong AI assistant ay maaaring matalino, ngunit ayon sa mga mananaliksik, dapat itong tratuhin na may parehong pagdududa kung paano tinatanggap ng iyong computer ang isang random na napapag-download na programa. Isang papel noong Mayo 2026 na napanaliksik sa arXiv ay nagpapakita na ang mga AI agent, lalo na ang mga nagdadala ng financial transactions, ay kailangang disenyo bilang mga komponenteng hindi tiyakin sa loob ng mas malalaking sistema.
Ang papel, na may pamagat na “Agent Security is a Systems Problem” (arXiv:2605.18991), ay dumating sa isang panahon kung saan ang crypto industry ay nagtatalaga ng malaking tulong sa autonomous AI agents upang pamahalaan ang lahat mula sa DeFi trades hanggang sa wallet operations. Ang CEO ng Circle, Jeremy Allaire, ay nagproyekta na ang milyon-milyon na AI agents ay magtataglay ng sariling ekonomikong aktibidad gamit ang stablecoin sa susunod na tatlo hanggang limang taon.
Ang pagkakatulad sa operating system
Hindi tiwala ng modernong mga operating system sa mga indibidwal na proseso. Bawat aplikasyon ay tumatakbo sa isang sandbox na may limitadong pahintulot, maaaring mag-access lamang sa mga file na espesipikong ibinigay sa iyo, at tatanggalin kung subukang lumabas sa mga hangganan nito. Gusto ng mga mananaliksik na ma-applying ang parehong pilosopiya sa mga AI agent.
Ang papel ay nagtataguyod ng tatlong partikular na hakbang. Una, pagsasagawa ng security invariants sa sistema level, ibig sabihin ay mahigpit na patakaran na hindi maaaring i-override ng AI mismo. Ikalawa, pagsasagawa ng least-privilege sandboxing, kung saan ang mga agent ay nagkakaroon lamang ng access sa pinakamababang yaman na kailangan para sa kanilang partikular na gawain. Ikatlo, pagpapakatotoo ng epektibong paghihiwalay ng mga instruksyon mula sa data, na naglalutas sa isa sa pinakamapanganib na attack vector sa mga AI system sa kasalukuyan.
Mas mahalaga ang huling punto kaysa sa maaaring mukhang. Gumagana ang mga pag-atake sa prompt injection eksaktong dahil madalas ay hindi kayang magkaiba ng mga legal na utos at masasamang data na naglalaman ng hidden commands. Kapag pinoproseso ng isang agent ang isang transaction memo na naglalaman ng lihim na mga utos upang i-redirect ang mga pondo, ang kakulangan sa pagkakahiwalay ay naging isang problema na $500,000.
Ang $500K na pagbabangon
Hindi iyon isang hipotetikal na bilang. Isang insidente noong Abril 2026 ay nagresulta sa eksaktong dami na tinanggal mula sa isang crypto wallet dahil sa mga kakulangan sa AI infrastructure at mga masamang pagtawag sa mga tool. Ang pag-atake ay nagpahalili sa uri ng vulnerability na binabalaan ng mga siyentipiko: isang AI agent na may sobrang access, kulang na pag-verify sa mga tool na itinawag nito, at walang system-level na guardrails upang matanggap ang anomaliya bago umalis ang pera mula sa wallet.
Ang awtonomong kalikasan ng mga agent na ito ay nagpapalala sa panganib. Ang isang tao na trader na tumatanggap ng phishing email ay maaaring maghintay at mag-isip. Ang isang AI agent na tumatanggap ng maingat na disenyo na prompt injection ay agad ito ginagawa sa machine speed, na maaaring magdulot ng pagbawas ng mga ari-arian bago makareaksyon ang anumang sistema ng pagmamonitor.
Mga tugon sa hardware at pamamahala
Ang ilang kumpanya ay nagsisimula nang umiikot sa direksyon na inirerekomenda ng papel. Ang Ledger ay naglathala ng 2026 security roadmap na naglalaman ng mga hakbang sa hardware security na espesipikong disenyo para sa mga AI agent environment. Ang lohika ay simpleng: kung hindi mo maaaring buong tiisin ang software layer, i-anchored ang mga kritikal na operasyon sa hardware na nagbibigay ng cryptographic guarantees na independiyente sa pag-uugali ng AI.
Ang rekomendasyon ng papel na tratuhin ito bilang isang “systems problem” kaysa isang “model problem” ay isang makabuluhang pagkakaiba. Ito ay nagpapalipat ng responsibilidad mula sa mga developer ng AI lamang patungo sa mas malawak na ecosystem ng mga tagapagbigay ng infrastraktura, mga disenyoer ng protokolo, at mga operator ng platform.
Ano ang ibig sabihin nito para sa mga investor
Makinig sa mga protokolo na nagpapatupad ng verifiable computation para sa mga aksyon ng AI agent, on-chain attestation ng pag-uugali ng agent, at mandatory least-privilege access controls. Ang mga tampok na ito ay malamang magiging table stakes para sa mga platform ng AI agent na institutional-grade sa susunod na 12 hanggang 18 buwan.
