Ethereum kurucusu Vitalik Buterin, bulut AI hizmetlerinden tamamen ayrıldı ve bu hafta yayımladığı bir blog yazısında tamamen yerel, yalıtılmış yapay zeka (AI) kurulumunu detaylandırdı.
Ana Noktalar:
- Ethereum kurucusu Vitalik Buterin, Nisan 2026'da bulut AI'yi terk ederek, Nvidia 5090 laptopunda Qwen3.5:35B'yi saniyede 90 token hızında yerel olarak çalıştırdı.
- Buterin, güvenlik firması Hiddenlayer'den elde edilen verilere dayanarak, AI ajant becerilerinin yaklaşık %15'inin zararlı talimatlar içerdiğini tespit etti.
- Açık kaynaklı mesajlaşma daemon'u, tüm dışa doğru Signal ve e-posta işlemlerinde insan-plus-LLM 2-of-2 onay kuralını zorunlu kılar.
Vitalik Buterin, Bulut Erişimi Olmadan Kendini Yöneten Bir Yapay Zeka Sistemi Nasıl Çalıştırır
Buterin, sistemi “kendi kendini yöneten / yerel / özel / güvenli” olarak tanımladı ve bunun, AI agent alanında yayılan ciddi güvenlik ve gizlilik hatalarına doğrudan yanıt olarak geliştirildiğini söyledi. Araştırmalara göre, agent becerilerinin veya eklenti araçlarının yaklaşık %15’inin zararlı talimatlar içerdiğini işaret etti. Güvenlik firması Hiddenlayer, tek bir zararlı web sayfasının ayrıştırılmasının bir Openclaw örneğini tamamen ele geçirebileceğini, bunun sonucunda kullanıcı farkındalığı olmadan kabuk betiklerini indirip çalıştırabileceğini gösterdi.
“Sonunda uçtan uca şifreleme ve giderek artan yerel-öncü yazılımlarla gizlilikte bir adım ileriye gitmeye başladığımızda, on adım geriye doğru gitmek üzere olduğumuz konusunda derin bir korkuyla geliyorum,” diye yazdı Buterin.
Seçtiği donanım, 24 GB video belleğe sahip bir Nvidia 5090 GPU içeren bir dizüstü bilgisayardır. Alibaba'nın açık ağırlıklı Qwen3.5:35B modelini llama-server üzerinden çalıştırdığında, bu kurulum saniyede 90 token ulaşır; bu, Buterin'in günlük kullanım için hedeflediği hızdır. 128 GB birleşik belleğe sahip AMD Ryzen AI Max Pro'yu test etti ve saniyede 51 token elde etti; DGX Spark ise saniyede 60 tokene ulaştı.
DGX Spark'ın, maliyeti ve iyi bir dizüstü bilgisayar GPU'suna göre daha düşük verimliliği nedeniyle etkileyici olmadığını söyledi. İşletim sistemi için Buterin, Arch Linux'tan NixOS'e geçti; bu sistem, kullanıcıların tüm sistem yapılandırmasını tek bir deklaratif dosyada tanımlamalarını sağlıyor. Llama-server'ı, herhangi bir uygulamanın bağlanabileceği yerel bir portu açan arka plan daemonu olarak kullanıyor.
Claude Code, yerel bir llama-server örneğine Anthropic sunucuları yerine yönlendirilebileceğini belirtti. İzolasyon, güvenlik modelinin merkezidir. Tek bir komutla herhangi bir dizinden izole ortamlar oluşturmak için bubblewrap kullanır. Bu kum kutuları içinde çalışan işlemler, yalnızca açıkça izin verilen dosyalara ve kontrol edilen ağ portlarına erişebilir. Buterin, signal-cli ve e-postayı sarmalayan bir mesajlaşma daemonunu github.com/vbuterin/messaging-daemon adresinde açık kaynaklı hale getirdi.
O, daemon'ın mesajları serbestçe okuyabileceğini ve onay olmadan kendisine mesaj gönderebileceğini belirtti. Üçüncü taraflara yönelik tüm dış mesajlar açık insan onayı gerektirir. Buna "insan + LLM 2-of-2" modeli dedi ve aynı mantığın Ethereum cüzdanlarına da uygulandığını söyledi. AI ile bağlantılı cüzdan araçları geliştiren takımlara, otonom işlemlerini günlük 100 dolarla sınırlamayı ve daha yüksek tutarlar için veya veri sızdırmak için calldata taşıyan herhangi bir işlem için insan onayı istemeyi önerdi.
Uzaktan Çıkarım, Buterin’in Şartlarıyla
Araştırma görevleri için Buterin, kendi pi agent çerçevesini ve SearXNG ile birlikte kullandığı yerel araç olan Local Deep Research’i karşılaştırdı. Pi ve SearXNG’nin daha kaliteli cevaplar ürettiğini söyledi. Dışarıdan arama sorgularına olan bağımlılığını azaltmak için yaklaşık 1 terabayt yerel Wikipedia veri setini ve teknik belgeleri birlikte saklıyor; bu sorguları bir gizlilik ihlali olarak görüyor.
Ayrıca, github.com/vbuterin/stt-daemon adresinde yerel bir ses transkripsiyonu arka plan programı yayınladı. Araç, temel kullanım için GPU gerektirmiyor ve çıktıyı düzeltme ve özetleme amacıyla LLM'ye aktarıyor. Ethereum entegrasyonu konusunda Buterin, AI ajanların sınırsız cüzdan erişimine sahip olmaması gerektiğini söyledi. İnsanı ve LLM'yi, farklı hata modlarını tespit eden iki ayrı onay faktörü olarak ele almayı önerdi.
Yerel modellerin yetersiz kaldığı durumlarda, Buterin, uzaktan çıkarım için gizliliği koruyan bir yaklaşım öne sürdü. Kendi ZK-API önerisini araştırmacı Davide ile birlikte, Openanonymity projesini ve sunucuların IP adresleriyle ardışık istekleri ilişkilendirmesini engellemek için mixnetlerin kullanımını örnek gösterdi. Ayrıca, yakın bir gelecekte uzaktan çıkarımdan kaynaklanan veri sızıntılarını azaltmanın bir yolu olarak güvenilir yürütme ortamlarına da değindi; ancak özel bulut çıkarımı için tamamen homomorfik şifrelemenin günümüzde pratik olacak kadar yavaş kaldığını belirtti.
Buterin, gönderinin bir başlangıç noktası olduğunu, bitmiş bir ürün olmadığını belirterek okuyucuları tam olarak aynı araçları kopyalamaktan ve bunların güvenli olduğunu varsaymaktan uyardı.

