นักวิจัยเรียกร้องให้จัดการเอเจนต์ปัญญาประดิษฐ์เป็นระบบที่ไม่น่าเชื่อถือเพื่อความปลอดภัยของคริปโต

ผู้ช่วย AI ที่คุณโปรดปรานอาจฉลาด แต่นักวิจัยตอนนี้โต้แย้งว่าควรจัดการกับมันด้วยความระมัดระวังเช่นเดียวกับที่คอมพิวเตอร์จัดการกับโปรแกรมที่ดาวน์โหลดมาแบบสุ่ม บทความเดือนพฤษภาคม 2026 ที่ตีพิมพ์บน arXiv ชี้ให้เห็นว่าตัวแทน AI โดยเฉพาะอย่างยิ่งที่จัดการธุรกรรมทางการเงิน ควรได้รับการออกแบบให้เป็นส่วนประกอบที่ไม่ได้รับความเชื่อถือโดยพื้นฐานภายในระบบขนาดใหญ่

เอกสารที่มีชื่อว่า “Agent Security is a Systems Problem” (arXiv:2605.18991) ออกมาในช่วงเวลาที่อุตสาหกรรมคริปโตกำลังลงทุนอย่างหนักในตัวแทน AI อัตโนมัติเพื่อจัดการทุกอย่างตั้งแต่การซื้อขาย DeFi ไปจนถึงการดำเนินการวอลเล็ต ซีอีโอของ Circle เจเรมี อัลเลียร์ คาดการณ์ว่าจะมีตัวแทน AI หลายพันล้านตัวดำเนินกิจกรรมทางเศรษฐกิจด้วย Stablecoin ภายในสามถึงห้าปีข้างหน้า

การเปรียบเทียบระบบปฏิบัติการ

ระบบปฏิบัติการสมัยใหม่ไม่ไว้วางใจกระบวนการแต่ละกระบวนการ แอปพลิเคชันทุกตัวทำงานในสภาพแวดล้อมกักกันที่มีสิทธิ์จำกัด สามารถเข้าถึงไฟล์ได้เฉพาะที่ได้รับการอนุญาตอย่างชัดเจน และจะถูกปิดตัวลงหากพยายามออกนอกขอบเขตของมัน นักวิจัยต้องการให้ปรัชญาเดียวกันนี้นำไปใช้กับตัวแทน AI

โฆษณา

เอกสารนี้สนับสนุนมาตรการสามประการเฉพาะเจาะจง ประการแรก บังคับใช้ความมั่นคงปลอดภัยในระดับระบบ หมายถึงกฎที่เข้มงวดซึ่งไม่สามารถถูกยกเลิกโดย AI เองได้ ประการที่สอง ดำเนินการแยกสภาพแวดล้อมแบบมีสิทธิ์ขั้นต่ำสุด โดยตัวแทนจะได้รับการเข้าถึงทรัพยากรขั้นต่ำสุดที่จำเป็นสำหรับงานเฉพาะของตน ประการที่สาม รับประกันการแยกคำสั่งออกจากข้อมูลอย่างมีประสิทธิภาพ ซึ่งช่วยแก้ไขหนึ่งในช่องโหว่การโจมตีที่อันตรายที่สุดในระบบ AI ปัจจุบัน

จุดสุดท้ายนี้มีความสำคัญมากกว่าที่ดูเหมือน การโจมตีแบบ prompt injection ใช้ได้ผลเพราะตัวแทน AI มักไม่สามารถแยกแยะระหว่างคำสั่งที่ถูกต้องกับข้อมูลที่เป็นอันตรายซึ่งมีคำสั่งซ่อนอยู่ เมื่อตัวแทนประมวลผลบันทึกธุรกรรมที่แฝงคำสั่งเพื่อเปลี่ยนทิศทางเงินทุน ความไม่มีการแยกแยะนี้จะกลายเป็นปัญหาที่มีมูลค่า 500,000 ดอลลาร์

การปลุกให้ตื่นด้วยเงิน 500,000 ดอลลาร์

ตัวเลขนั้นไม่ใช่สมมติฐาน เหตุการณ์ในเดือนเมษายน 2026 ส่งผลให้มีจำนวนเงินเท่ากับนั้นถูกดึงออกจากวอลเล็ตคริปโตเนื่องจากข้อบกพร่องในโครงสร้างพื้นฐานของปัญญาประดิษฐ์และการเรียกใช้เครื่องมือที่มีเจตนาไม่ดี การโจมตีนี้ใช้ช่องโหว่ประเภทที่นักวิจัยเตือนไว้: ตัวแทนปัญญาประดิษฐ์ที่มีสิทธิ์เข้าถึงมากเกินไป การตรวจสอบเครื่องมือที่เรียกใช้ไม่เพียงพอ และไม่มีระบบป้องกันระดับระบบเพื่อจับความผิดปกติก่อนที่เงินจะออกจากวอลเล็ต

ลักษณะอัตโนมัติของตัวแทนเหล่านี้ทำให้ความเสี่ยงเพิ่มขึ้น ผู้ค้ามนุษย์ที่ได้รับอีเมลหลอกลวงอาจหยุดคิดก่อน แต่ตัวแทน AI ที่ได้รับการโจมตีด้วยคำสั่งที่ออกแบบมาอย่างระมัดระวังจะดำเนินการด้วยความเร็วของเครื่อง ซึ่งอาจทำให้ทรัพย์สินถูกดึงออกก่อนระบบตรวจสอบใดๆ จะสามารถตอบสนองได้

การตอบสนองด้านฮาร์ดแวร์และการกำกับดูแล

บางบริษัทได้เริ่มเคลื่อนตัวไปในทิศทางที่เอกสารแนะนำแล้ว Ledger ได้เปิดเผยแผนภูมิความปลอดภัยปี 2026 ซึ่งรวมถึงแนวทางด้านความปลอดภัยแบบฮาร์ดแวร์ที่ออกแบบมาโดยเฉพาะสำหรับสภาพแวดล้อมของตัวแทน AI เหตุผลนั้นตรงไปตรงมา: หากคุณไม่สามารถไว้วางใจชั้นซอฟต์แวร์ได้อย่างสมบูรณ์ ให้ผูกการดำเนินการที่สำคัญกับฮาร์ดแวร์ที่ให้การรับรองทางคริปโตกราฟีโดยไม่ขึ้นกับพฤติกรรมของ AI

คำแนะนำในเอกสารที่ให้จัดการปัญหานี้เป็น “ปัญหาเชิงระบบ” แทนที่จะเป็น “ปัญหาเชิงโมเดล” เป็นการแยกแยะที่มีความหมาย มันเปลี่ยนความรับผิดชอบจากนักพัฒนา AI เพียงผู้เดียวไปยังระบบนิเวศที่กว้างขึ้นซึ่งประกอบด้วยผู้ให้บริการโครงสร้างพื้นฐาน ผู้ออกแบบโปรโตคอล และผู้ดำเนินการแพลตฟอร์ม

สิ่งนี้หมายความว่าอย่างไรสำหรับนักลงทุน

ตรวจสอบโปรโตคอลที่ใช้การคำนวณที่สามารถตรวจสอบได้สำหรับการกระทำของตัวแทน AI การรับรองพฤติกรรมของตัวแทนบนโซ่ และการควบคุมการเข้าถึงแบบ least-privilege ที่บังคับใช้ คุณสมบัติเหล่านี้มีแนวโน้มจะกลายเป็นมาตรฐานพื้นฐานสำหรับแพลตฟอร์มตัวแทน AI ระดับสถาบันภายใน 12 ถึง 18 เดือนข้างหน้า