วิตาลิก บูเทอริน แห่ง Ethereum เตือนถึงความเสี่ยงด้านความปลอดภัยของตัวแทน AI พร้อมรายละเอียดการตั้งค่า AI แบบท้องถิ่น

ผู้ร่วมก่อตั้ง Ethereum วิตาลิก บูเทอริน ได้เลิกใช้บริการ AI บนคลาวด์ทั้งหมด และอธิบายรายละเอียดการตั้งค่าปัญญาประดิษฐ์ (AI) แบบเต็มรูปแบบบนอุปกรณ์ส่วนตัวที่แยกตัวอย่างสมบูรณ์ในโพสต์บล็อกที่เผยแพร่เมื่อสัปดาห์นี้

ประเด็นสำคัญ:

ผู้ร่วมก่อตั้ง Ethereum Vitalik Buterin ได้เลิกใช้ AI บนคลาวด์ในเดือนเมษายน 2026 โดยรัน Qwen3.5:35B แบบโลคัลบนแล็ปท็อป Nvidia 5090 ที่ความเร็ว 90 โทเค็นต่อวินาที
บูเทอรินพบว่าประมาณ 15% ของทักษะตัวแทน AI มีคำสั่งที่เป็นอันตราย โดยอ้างข้อมูลจากบริษัทด้านความปลอดภัย Hiddenlayer
เดโมนการส่งข้อความแบบเปิดแหล่งที่มาของเขาบังคับใช้กฎการยืนยัน 2 จาก 2 แบบมนุษย์บวกกับ LLM สำหรับการกระทำทั้งหมดที่ส่งออกไปยังบุคคลที่สามผ่าน Signal และอีเมล

วิธีที่วิทาลิก บูเทอริน ใช้งานระบบปัญญาประดิษฐ์ที่ควบคุมด้วยตนเองโดยไม่ใช้การเข้าถึงคลาวด์

บูเทอริน อธิบาย ระบบว่า “เป็นของตนเอง / ท้องถิ่น / ส่วนตัว / ปลอดภัย” และกล่าวว่าระบบถูกสร้างขึ้นเพื่อตอบสนองโดยตรงต่อข้อผิดพลาดด้านความปลอดภัยและความเป็นส่วนตัวที่รุนแรงซึ่งกำลังแพร่กระจายในพื้นที่ AI agent เขาชี้ให้เห็นถึงการวิจัยที่แสดงว่าประมาณ 15% ของทักษะของตัวแทน หรือเครื่องมือปลั๊กอิน มีคำสั่งที่เป็นอันตราย บริษัทด้านความปลอดภัย Hiddenlayer แสดงให้เห็น ว่าการประมวลผลหน้าเว็บที่เป็นอันตรายเพียงหน้าเดียวสามารถทำลายระบบ Openclaw ได้อย่างสมบูรณ์ ทำให้สามารถดาวน์โหลดและรันสคริปต์เปลือกโดยไม่ต้องมีการรับรู้จากผู้ใช้

“ฉันมาจากมุมมองที่กลัวอย่างลึกซึ้งว่า แม้เราจะเพิ่งเริ่มก้าวไปข้างหน้าในด้านความเป็นส่วนตัวด้วยการนำการเข้ารหัสแบบปลายทางถึงปลายทางมาใช้ในวงกว้างและซอฟต์แวร์ที่เน้นท้องถิ่นมากขึ้นเรื่อยๆ เรากำลังจะถอยหลังไปสิบก้าว” บูเทอรินเขียน

อุปกรณ์ที่เขาเลือกใช้คือแล็ปท็อปที่รัน GPU Nvidia 5090 พร้อมหน่วยความจำวิดีโอ 24 GB เมื่อรันโมเดล Qwen3.5:35B จาก Alibaba ที่มีน้ำหนักเปิดผ่าน llama-server ระบบสามารถทำงานได้ที่ 90 โทเค็นต่อวินาที ซึ่ง Buterin เรียกว่าเป็นเป้าหมายสำหรับการใช้งานรายวันอย่างสบายๆ เขาได้ทดสอบ AMD Ryzen AI Max Pro ที่มีหน่วยความจำรวม 128 GB ซึ่งทำได้ที่ 51 โทเค็นต่อวินาที และ DGX Spark ซึ่งทำได้ที่ 60 โทเค็นต่อวินาที

เขาบอกว่า DGX Spark ซึ่งถูกตลาดเป็นซูเปอร์คอมพิวเตอร์ AI สำหรับตั้งโต๊ะ ดูไม่น่าประทับใจเมื่อพิจารณาจากต้นทุนและการผ่านข้อมูลที่ต่ำกว่า GPU ของแล็ปท็อปที่ดี ในระบบปฏิบัติการของเขา Buterin เปลี่ยนจาก Arch Linux เป็น NixOS ซึ่งช่วยให้ผู้ใช้สามารถกำหนดการตั้งค่าระบบทั้งหมดในไฟล์เชิงประกาศเดียว เขาใช้ llama-server เป็นเดโมนพื้นหลังที่เปิดพอร์ตท้องถิ่นให้แอปพลิเคชันใดๆ ก็ตามสามารถเชื่อมต่อได้

Claude Code เขาอธิบายว่า สามารถชี้ไปยังอินสแตนซ์ llama-server แบบท้องถิ่นแทนเซิร์ฟเวอร์ของ Anthropic การแยกสภาพแวดล้อมเป็นหัวใจสำคัญของโมเดลด้านความปลอดภัยของเขา เขาใช้ bubblewrap เพื่อสร้างสภาพแวดล้อมที่แยกจากไดเรกทอรีใดๆ ด้วยคำสั่งเดียว กระบวนการที่ทำงานภายในสภาพแวดล้อมเหล่านั้นสามารถเข้าถึงไฟล์ที่ได้รับอนุญาตอย่างชัดเจนและพอร์ตเครือข่ายที่ควบคุมเท่านั้น Buterin เปิดรหัสแหล่งที่มาของ daemon การส่งข้อความที่ github.com/vbuterin/messaging-daemon ซึ่งห่อ signal-cli และอีเมล

เขาแสดงความเห็นว่า daemon สามารถอ่านข้อความได้อย่างอิสระและส่งข้อความถึงตัวเองได้โดยไม่ต้องได้รับการยืนยัน ข้อความใดๆ ที่ส่งออกไปยังบุคคลที่สามจะต้องได้รับการอนุมัติจากมนุษย์อย่างชัดเจน เขาเรียกสิ่งนี้ว่า “โมเดลมนุษย์ + LLM 2-of-2” และกล่าวว่าตรรกะเดียวกันนี้ใช้ได้กับ Ethereum วอลเล็ต เขาแนะนำทีมที่พัฒนาเครื่องมือวอลเล็ตที่เชื่อมต่อกับ AI ให้จำกัดการทำธุรกรรมอัตโนมัติไว้ที่ $100 ต่อวัน และต้องขอการยืนยันจากมนุษย์สำหรับธุรกรรมใดๆ ที่เกินกว่านั้น หรือธุรกรรมใดๆ ที่มี calldata ที่อาจขโมยข้อมูล

การประมวลผลแบบระยะไกล ตามเงื่อนไขของ Buterin

สำหรับงานวิจัย บูเทอรินเปรียบเทียบเครื่องมือท้องถิ่น Local Deep Research กับการตั้งค่าของตัวเองโดยใช้กรอบงาน pi agent ร่วมกับ SearXNG เครื่องมือค้นหาแบบเมตาที่โฮสต์เองและเน้นความเป็นส่วนตัว เขาบอกว่า pi ร่วมกับ SearXNG ให้คำตอบที่มีคุณภาพดีกว่า เขาเก็บข้อมูล Wikipedia แบบโลคัลประมาณ 1 เทระไบต์พร้อมเอกสารทางเทคนิคเพื่อลดการพึ่งพาการค้นหาจากภายนอก ซึ่งเขาถือว่าเป็นการรั่วไหลของความเป็นส่วนตัว

เขายังเผยแพร่เดโมนแปลงเสียงท้องถิ่นที่ github.com/vbuterin/stt-daemon เครื่องมือนี้ทำงานได้โดยไม่ต้องใช้ GPU สำหรับการใช้งานพื้นฐาน และส่งผลลัพธ์ไปยัง LLM เพื่อแก้ไขและสรุป สำหรับการบูรณาการกับ Ethereum Buterin กล่าวว่าตัวแทน AI ไม่ควรได้รับการเข้าถึง วอลเล็ต โดยไม่มีข้อจำกัด เขาแนะนำให้พิจารณามนุษย์และ LLM เป็นปัจจัยยืนยันสองประการที่ต่างกันในการจับข้อผิดพลาดที่แตกต่างกัน

สำหรับกรณีที่โมเดลท้องถิ่นไม่เพียงพอ บูเทอรินได้ระบุแนวทางที่รักษาความเป็นส่วนตัวสำหรับการคำนวณระยะไกล เขาชี้ให้เห็นถึงข้อเสนอ ZK-API ของตนเองร่วมกับนักวิจัยดาวิดี โครงการ Openanonymity และการใช้ mixnets เพื่อป้องกันไม่ให้เซิร์ฟเวอร์เชื่อมโยงคำขอที่ตามกันด้วยที่อยู่ IP เขายังอ้างถึงสภาพแวดล้อมการประมวลผลที่เชื่อถือได้เป็นวิธีหนึ่งในการลดการรั่วไหลของข้อมูลจากการคำนวณระยะไกลในระยะสั้น ขณะที่เขาชี้ให้เห็นว่าการเข้ารหัสแบบโฮโมมอร์ฟิกเต็มรูปแบบสำหรับการคำนวณบนคลาวด์แบบส่วนตัวยังช้าเกินไปจนไม่สามารถใช้งานได้จริงในปัจจุบัน

บูเทอรินปิดท้ายด้วยการระบุว่าโพสต์นี้เป็นจุดเริ่มต้น ไม่ใช่ผลิตภัณฑ์ที่สมบูรณ์ และเตือนผู้อ่านอย่าคัดลอกเครื่องมือของเขาอย่างตรงไปตรงมาและถือว่ามันปลอดภัย