ईथेरियम के सह-स्थापक विटालिक बुटेरिन ने क्लाउड एआई सेवाओं से पूरी तरह अलग हो गए हैं और इस हफ्ते प्रकाशित एक ब्लॉग पोस्ट में अपनी पूरी तरह स्थानीय, सैंडबॉक्स्ड कृत्रिम बुद्धिमत्ता (एआई) सेटअप का विस्तार से वर्णन किया है।
मुख्य बिंदु:
- ईथेरियम सह-स्थापक विटालिक बुटेरिन ने अप्रैल 2026 में क्लाउड एआई को छोड़ दिया, और एनविडिया 5090 लैपटॉप पर Qwen3.5:35B को स्थानीय रूप से 90 टोकन प्रति सेकंड की दर से चलाया।
- बुटेरिन ने सुरक्षा कंपनी हिडनलेयर से प्राप्त डेटा का उल्लेख करते हुए पाया कि लगभग 15% एआई एजेंट कौशल में दुर्भावनापूर्ण निर्देश होते हैं।
- उसका ओपन-सोर्स संदेश डीमन सभी बाहरी सिग्नल और ईमेल कार्रवाइयों के लिए मानव-प्लस-LLM 2-ऑफ-2 पुष्टि नियम लागू करता है।
विकालिक बुटेरिन कैसे चलाते हैं एक सेल्फ-सोवरेन AI सिस्टम बिना क्लाउड एक्सेस के
बुटेरिन ने प्रणाली को “स्व-संप्रभु / स्थानीय / निजी / सुरक्षित” के रूप में वर्णित किया और कहा कि इसे उन गंभीर सुरक्षा और गोपनीयता की विफलताओं के प्रत्यक्ष प्रतिक्रिया के रूप में बनाया गया है, जो AI एजेंट क्षेत्र में फैल रही हैं। उन्होंने ऐसे शोध की ओर इशारा किया जिसमें लगभग 15% एजेंट कौशल, या प्लग-इन उपकरणों में दुर्भावनापूर्ण निर्देश होते हैं। सुरक्षा कंपनी हिडनलेयर ने दर्शाया कि एक एकल दुर्भावनापूर्ण वेब पेज को पार्स करके Openclaw उदाहरण को पूरी तरह से संक्रमित किया जा सकता है, जिससे उपयोगकर्ता की जागरूकता के बिना यह शेल स्क्रिप्ट्स डाउनलोड और निष्पादित कर सकता है।
"मैं एक ऐसे मानसिकता से आया हूँ जो गहराई से डरी हुई है कि जब हम अंत से अंत तक एन्क्रिप्शन के प्रचलन और अधिक और अधिक स्थानीय-पहले सॉफ्टवेयर के साथ गोपनीयता में आखिरकार एक कदम आगे बढ़ रहे थे, तो हम दस कदम पीछे जाने के कगार पर हैं," बुटेरिन ने लिखा।
उनका चुना हुआ हार्डवेयर एक लैपटॉप है जिसमें Nvidia 5090 GPU है और 24 GB वीडियो मेमोरी है। llama-server के माध्यम से Alibaba के ओपन-वेट्स Qwen3.5:35B मॉडल को चलाने पर, यह सेटअप 90 टोकन प्रति सेकंड प्राप्त करता है, जिसे Buterin आरामदायक दैनिक उपयोग के लिए लक्ष्य मानते हैं। उन्होंने AMD Ryzen AI Max Pro का परीक्षण किया, जिसमें 128 GB यूनिफाइड मेमोरी है, जिसने 51 टोकन प्रति सेकंड प्राप्त किए, और DGX Spark, जिसने 60 टोकन प्रति सेकंड प्राप्त किए।
उन्होंने कहा कि DGX Spark, जिसे एक डेस्कटॉप AI सुपरकंप्यूटर के रूप में बाजार में लाया गया है, अपनी लागत और एक अच्छे लैपटॉप GPU की तुलना में कम थ्रूपुट के कारण अप्रभावशाली लगा। अपने ऑपरेटिंग सिस्टम के लिए, Buterin ने Arch Linux से NixOS पर स्विच कर दिया, जो उपयोगकर्ताओं को अपनी पूरी सिस्टम कॉन्फ़िगरेशन को एकल घोषणात्मक फ़ाइल में परिभाषित करने की अनुमति देता है। वह llama-server का उपयोग एक बैकग्राउंड डीमन के रूप में करता है, जो किसी भी एप्लिकेशन के लिए स्थानीय पोर्ट को उपलब्ध कराता है।
Claude Code, उन्होंने नोट किया, स्थानीय llama-server इंस्टेंस की ओर इशारा किया जा सकता है, Anthropic के सर्वर्स के बजाय। सैंडबॉक्सिंग उनके सुरक्षा मॉडल का केंद्रीय तत्व है। वह एक ही कमांड से किसी भी डायरेक्टरी से बबलव्रैप का उपयोग करके अलग-अलग वातावरण बनाता है। उन सैंडबॉक्स के भीतर चल रही प्रक्रियाएं केवल स्पष्ट रूप से अनुमति दिए गए फाइलों और नियंत्रित नेटवर्क पोर्ट्स तक ही पहुँच सकती हैं। बुटेरिन ने github.com/vbuterin/messaging-daemon पर एक मैसेजिंग डीमन को ओपन-सोर्स किया है जो signal-cli और ईमेल को लपेटता है।
उन्होंने कहा कि डेमन संदेशों को स्वतंत्र रूप से पढ़ सकता है और पुष्टि के बिना खुद को संदेश भेज सकता है। किसी तीसरे पक्ष को बाहरी संदेश भेजने के लिए स्पष्ट मानव अनुमति की आवश्यकता होती है। उन्होंने इसे “मानव + LLM 2-में-2” मॉडल कहा, और कहा कि यही तर्क Ethereum वॉलेट्स पर भी लागू होता है। उन्होंने AI-जुड़े वॉलेट टूल बनाने वाली टीमों को प्रतिदिन स्वयंचालित लेनदेन को $100 तक सीमित रखने और इससे अधिक या किसी ऐसे लेनदेन के लिए मानव पुष्टि की आवश्यकता होने की सलाह दी, जिसमें कैलडाटा हो सकता है जो डेटा को बाहर निकाल सकता है।
रिमोट इन्फरेंस, बुटेरिन की शर्तों पर
शोध कार्यों के लिए, बुटेरिन ने स्थानीय उपकरण Local Deep Research की तुलना अपने स्वयं के सेटअप, जो pi एजेंट फ्रेमवर्क के साथ SearXNG, एक स्व-होस्टेड गोपनीयता-केंद्रित मेटा-खोज इंजन के साथ जोड़ा गया है, से की। उन्होंने कहा कि pi और SearXNG का संयोजन बेहतर गुणवत्ता वाले उत्तर प्रदान करता है। वह अपनी बाहरी खोज पूछताछ पर निर्भरता कम करने के लिए लगभग 1 टेराबाइट का स्थानीय Wikipedia डंप और तकनीकी दस्तावेज़ संग्रहित करते हैं, जिन्हें वह गोपनीयता लीक के रूप में मानते हैं।
उन्होंने github.com/vbuterin/stt-daemon पर एक स्थानीय ऑडियो ट्रांसक्रिप्शन डीमन भी प्रकाशित किया। यह उपकरण बेसिक उपयोग के लिए GPU के बिना चलता है और आउटपुट को सुधार और सारांशित करने के लिए LLM को प्रदान करता है। ईथेरियम एकीकरण पर, बुटेरिन ने कहा कि AI एजेंट्स को कभी असीमित वॉलेट एक्सेस नहीं देना चाहिए। उन्होंने मानव और LLM को दो अलग-अलग पुष्टि कारक के रूप में मानने की सिफारिश की, जो प्रत्येक अलग-अलग विफलता के मोड को पकड़ते हैं।
जहाँ स्थानीय मॉडल कमजोर होते हैं, बुटेरिन ने दूरस्थ निष्कर्षण के लिए गोपनीयता-संरक्षित दृष्टिकोण का उल्लेख किया। उन्होंने अपने ZK-API प्रस्ताव का उल्लेख किया, जिसे शोधकर्ता डेविड के साथ विकसित किया गया, Openanonymity प्रोजेक्ट, और IP पते द्वारा लगातार अनुरोधों को जोड़ने से रोकने के लिए मिक्सनेट्स का उपयोग। उन्होंने निकट भविष्य में दूरस्थ निष्कर्षण से डेटा रिसाव को कम करने के लिए विश्वसनीय निष्पादन परिवेशों का भी उल्लेख किया, जबकि निजी क्लाउड निष्कर्षण के लिए पूर्ण सममिति संकेतन अभी भी व्यावहारिक होने के लिए बहुत धीमा है।
बुटेरिन ने एक नोट के साथ समाप्त किया कि यह पोस्ट एक शुरुआती बिंदु का वर्णन करती है, एक पूर्ण उत्पाद नहीं, और पाठकों को उनके सटीक उपकरणों की प्रतिलिपि बनाने और उन्हें सुरक्षित मानने से चेतावनी दी।

