Pendiri ethereum Vitalik Buterin telah berpindah sepenuhnya keluar dari perkhidmatan AI awan dan menerangkan pengaturan kecerdasan buatan (AI) sepenuhnya tempatan dan disekatkan dalam posting blog yang diterbitkan minggu ini.
Mata Pelajaran Utama:
- Pendiri ethereum Vitalik Buterin meninggalkan AI awan pada April 2026, menjalankan Qwen3.5:35B secara tempatan pada laptop Nvidia 5090 pada 90 token per saat.
- Buterin mendapati bahawa kira-kira 15% kemahiran agen AI mengandungi arahan jahat, merujuk kepada data daripada syarikat keselamatan Hiddenlayer.
- Daemon pesan sumber terbukanya memaksakan peraturan pengesahan 2-dari-2 manusia-ditambah-LLM untuk semua tindakan keluar Signal dan e-mel kepada pihak ketiga.
Bagaimana Vitalik Buterin Menjalankan Sistem AI Berdaulat Diri Tanpa Akses Awan
Buterin menyatakan sistem tersebut sebagai “berdaulat sendiri / tempatan / peribadi / selamat” dan mengatakan ia dibina sebagai tindakan langsung terhadap kegagalan keselamatan dan privasi serius yang menyebar di kalangan ruang agen AI. Beliau merujuk kepada penyelidikan yang menunjukkan kira-kira 15% daripada kemahiran agen, atau alat plug-in, mengandungi arahan jahat. Syarikat keselamatan Hiddenlayer menggambarkan bahawa menganalisis satu halaman web jahat sahaja boleh mengompromikan sepenuhnya satu contoh Openclaw, membenarkannya memuat turun dan menjalankan skrip shell tanpa kesedaran pengguna.
"Saya datang dari pemikiran yang sangat takut bahawa justeru ketika kami akhirnya membuat langkah maju dalam privasi dengan pengenalan enkripsi end-to-end dan semakin banyak perisian berasaskan tempatan, kami berada di ambang mengambil sepuluh langkah ke belakang," tulis Buterin.
Peranti keras pilihannya ialah laptop yang menjalankan GPU Nvidia 5090 dengan 24 GB memori video. Dengan menjalankan model Qwen3.5:35B dari Alibaba dengan bobot terbuka melalui llama-server, pengaturan ini mencapai 90 token per saat, yang menurut Buterin merupakan sasaran untuk penggunaan harian yang selesa. Beliau menguji AMD Ryzen AI Max Pro dengan memori terpadu 128 GB, yang mencapai 51 token per saat, dan DGX Spark, yang mencapai 60 token per saat.
Dia mengatakan DGX Spark, yang dipasarkan sebagai superkomputer AI desktop, tidak menarik mengingat kosnya dan throughput yang lebih rendah berbanding GPU laptop yang baik. Untuk sistem operasinya, Buterin berpindah dari Arch Linux ke NixOS, yang membolehkan pengguna menentukan keseluruhan konfigurasi sistem mereka dalam satu fail deklaratif. Dia menggunakan llama-server sebagai daemon latar belakang yang memaparkan port tempatan yang boleh disambung oleh sebarang aplikasi.
Claude Code, katanya, boleh ditunjuk ke contoh local llama-server alih-alih pelayan Anthropic. Sandbox adalah pusat model keselamatan beliau. Beliau menggunakan bubblewrap untuk mencipta persekitaran terpisah dari mana-mana direktori dengan satu arahan. Proses yang berjalan di dalam sandbox tersebut hanya boleh mengakses fail yang secara eksplisit dibenarkan dan port rangkaian yang dikawal. Buterin membuka sumber daemon pesan di github.com/vbuterin/messaging-daemon yang membungkus signal-cli dan e-mel.
Beliau menyatakan bahawa daemon boleh membaca mesej dengan bebas dan menghantar mesej kepada dirinya sendiri tanpa pengesahan. Sebarang mesej keluar kepada pihak ketiga memerlukan persetujuan manusia yang jelas. Beliau menyebut ini sebagai model “manusia + LLM 2-dari-2”, dan berkata logik yang sama berlaku kepada Ethereum dompet. Beliau menasihati pasukan yang membina alat dompet yang disambungkan AI untuk menghadkan transaksi autonomi pada $100 sehari dan memerlukan pengesahan manusia untuk apa sahaja yang lebih tinggi atau sebarang transaksi yang membawa calldata yang boleh mengeksfiltrasi data.
Remote Inference, atas Syarat Buterin
Untuk tugas penyelidikan, Buterin membandingkan alat tempatan Local Deep Research dengan setup sendiri menggunakan kerangka pi agent yang dipasangkan dengan SearXNG, enjin carian meta yang fokus pada privasi dan dihoskan sendiri. Beliau berkata pi ditambah SearXNG menghasilkan jawapan yang berkualiti lebih baik. Beliau menyimpan salinan tempatan Wikipedia sebanyak kira-kira 1 terabait bersama dokumen teknikal untuk mengurangkan ketergantungan pada carian luar, yang dianggapnya sebagai kebocoran privasi.
Dia juga menerbitkan daemon transkripsi audio tempatan di github.com/vbuterin/stt-daemon. Alat ini berjalan tanpa GPU untuk penggunaan asas dan menghantar output kepada LLM untuk pembaikan dan ringkasan. Mengenai integrasi Ethereum, Buterin berkata agen AI tidak seharusnya mempunyai akses dompet tanpa sekatan. Dia merekomendasikan untuk memperlakukan manusia dan LLM sebagai dua faktor pengesahan yang berbeza yang masing-masing menangkap mod kegagalan yang berbeza.
Bagi kes-kes di mana model tempatan tidak mencukupi, Buterin menggariskan pendekatan yang melindungi privasi untuk inferens jauh. Beliau merujuk kepada cadangan ZK-API beliau bersama penyelidik Davide, projek Openanonymity, dan penggunaan mixnet untuk mencegah pelayan menghubungkan permintaan berturut-turut berdasarkan alamat IP. Beliau juga menyebut persekitaran pelaksanaan terpercaya sebagai cara untuk mengurangkan kebocoran data daripada inferens jauh dalam jangka pendek, sambil memperhatikan bahawa enkripsi homomorfik sepenuhnya untuk inferens awan peribadi masih terlalu perlahan untuk praktikal pada hari ini.
Buterin menutup dengan mencatat bahawa pos tersebut menggambarkan titik permulaan, bukan produk yang siap, dan memperingatkan pembaca supaya tidak menyalin alat tepatnya serta menganggapnya selamat.

