Vitalik Buterin dari Ethereum Memperingatkan Risiko Keamanan Agen AI, Merinci Pengaturan AI Lokal

Pendiri Ethereum Vitalik Buterin telah sepenuhnya meninggalkan layanan AI cloud dan mendetailkan setup kecerdasan buatan (AI) lokal penuh dan terisolasi miliknya dalam sebuah posting blog yang diterbitkan minggu ini.

Poin Utama:

Ko-founder Ethereum Vitalik Buterin meninggalkan AI cloud pada April 2026, menjalankan Qwen3.5:35B secara lokal di laptop Nvidia 5090 dengan kecepatan 90 token per detik.
Buterin menemukan bahwa sekitar 15% keterampilan agen AI mengandung instruksi jahat, mengutip data dari perusahaan keamanan Hiddenlayer.
Daemon pesan open-source-nya menegakkan aturan konfirmasi 2-dari-2 manusia-ditambah-LLM untuk semua tindakan keluar Signal dan email ke pihak ketiga.

Bagaimana Vitalik Buterin Menjalankan Sistem AI Otonom Tanpa Akses Cloud

Buterin menjelaskan sistem tersebut sebagai “self-sovereign / lokal / pribadi / aman” dan mengatakan bahwa sistem ini dibangun sebagai respons langsung terhadap kegagalan keamanan dan privasi serius yang menyebar di ruang AI agent. Ia menunjukkan penelitian yang menunjukkan sekitar 15% keterampilan agen, atau alat plug-in, mengandung instruksi jahat. Perusahaan keamanan Hiddenlayer menunjukkan bahwa memproses satu halaman web jahat saja dapat sepenuhnya mengompromikan instance Openclaw, memungkinkannya mengunduh dan mengeksekusi skrip shell tanpa kesadaran pengguna.

"Saya datang dari pola pikir yang sangat takut bahwa tepat ketika kami akhirnya membuat langkah maju dalam privasi dengan semakin meluasnya enkripsi end-to-end dan semakin banyak perangkat lunak yang berbasis lokal, kami berada di ambang mengambil sepuluh langkah mundur," tulis Buterin.

Perangkat keras pilihannya adalah laptop yang menjalankan GPU Nvidia 5090 dengan 24 GB memori video. Dengan menjalankan model Qwen3.5:35B dari Alibaba yang memiliki bobot terbuka melalui llama-server, pengaturan ini mencapai 90 token per detik, yang menurut Buterin menjadi target untuk penggunaan sehari-hari yang nyaman. Ia menguji AMD Ryzen AI Max Pro dengan memori terpadu 128 GB, yang mencapai 51 token per detik, serta DGX Spark, yang mencapai 60 token per detik.

Dia mengatakan DGX Spark, yang dipasarkan sebagai superkomputer AI desktop, tidak mengesankan mengingat harganya dan throughput yang lebih rendah dibandingkan GPU laptop yang baik. Untuk sistem operasinya, Buterin beralih dari Arch Linux ke NixOS, yang memungkinkan pengguna mendefinisikan seluruh konfigurasi sistem mereka dalam satu file deklaratif. Dia menggunakan llama-server sebagai daemon latar belakang yang membuka port lokal yang dapat diakses oleh aplikasi apa pun.

Claude Code, katanya, dapat diarahkan ke instance lokal llama-server alih-alih server Anthropic. Sandboxing merupakan inti dari model keamanannya. Ia menggunakan bubblewrap untuk membuat lingkungan terisolasi dari direktori mana pun dengan satu perintah. Proses yang berjalan di dalam sandbox tersebut hanya dapat mengakses file yang secara eksplisit diizinkan dan port jaringan yang dikendalikan. Buterin membuka sumber kode daemon pesan di github.com/vbuterin/messaging-daemon yang membungkus signal-cli dan email.

Dia menyatakan bahwa daemon dapat membaca pesan secara bebas dan mengirim pesan ke dirinya sendiri tanpa konfirmasi. Setiap pesan keluar ke pihak ketiga memerlukan persetujuan manusia secara eksplisit. Ia menyebut ini sebagai model “manusia + LLM 2-dari-2”, dan mengatakan logika yang sama berlaku untuk Ethereum dompet. Dia menyarankan tim yang mengembangkan alat dompet yang terhubung AI untuk membatasi transaksi otonom hingga $100 per hari dan memerlukan konfirmasi manusia untuk apa pun yang lebih tinggi atau transaksi apa pun yang membawa calldata yang dapat mengekstraksi data.

Remote Inference, atas Syarat Buterin

Untuk tugas penelitian, Buterin membandingkan alat lokal Local Deep Research dengan setup miliknya sendiri yang menggunakan kerangka kerja pi agent yang dipasangkan dengan SearXNG, mesin pencari meta berfokus pada privasi yang di-host sendiri. Ia mengatakan pi ditambah SearXNG menghasilkan jawaban dengan kualitas lebih baik. Ia menyimpan salinan lokal Wikipedia sekitar 1 terabyte bersama dokumentasi teknis untuk mengurangi ketergantungannya pada pencarian eksternal, yang ia anggap sebagai kebocoran privasi.

Dia juga menerbitkan daemon transkripsi audio lokal di github.com/vbuterin/stt-daemon. Alat ini berjalan tanpa GPU untuk penggunaan dasar dan mengirim output ke LLM untuk koreksi dan ringkasan. Mengenai integrasi Ethereum, Buterin mengatakan agen AI seharusnya tidak pernah memiliki akses dompet tanpa batas. Dia merekomendasikan untuk memperlakukan manusia dan LLM sebagai dua faktor konfirmasi terpisah yang masing-masing menangkap mode kegagalan yang berbeda.

Untuk kasus-kasus di mana model lokal tidak memadai, Buterin menjelaskan pendekatan yang menjaga privasi untuk inferensi jarak jauh. Ia menunjuk pada proposal ZK-API miliknya bersama peneliti Davide, proyek Openanonymity, dan penggunaan mixnet untuk mencegah server mengaitkan permintaan berturut-turut berdasarkan alamat IP. Ia juga menyebut lingkungan eksekusi terpercaya sebagai cara untuk mengurangi kebocoran data dari inferensi jarak jauh dalam jangka pendek, sambil mencatat bahwa enkripsi sepenuhnya homomorfik untuk inferensi cloud pribadi masih terlalu lambat untuk praktis saat ini.

Buterin menutup dengan catatan bahwa posting tersebut menggambarkan titik awal, bukan produk jadi, dan memperingatkan pembaca agar tidak meniru alatnya secara persis serta menganggapnya aman.