イーサリアムの共同創設者であるビタリク・ブテリンは、クラウドAIサービスを完全に利用しないようにし、今週公開したブログ投稿で、完全にローカルでサンドボックス化された人工知能(AI)環境を詳細に説明した。
主なポイント:
- Ethereumの共同創設者であるビタリク・ブテリンは2026年4月にクラウドAIを放棄し、Nvidia 5090搭載のラップトップでQwen3.5:35Bをローカルで実行し、秒間90トークンを処理した。
- Buterinは、セキュリティ企業Hiddenlayerのデータを引用し、AIエージェントのスキルの約15%に悪意のある指示が含まれていることを発見しました。
- 彼がオープンソース化したメッセージングデーモンは、第三者へのすべてのSignalおよびメールアクションに対して、ヒューマン+LLMの2-of-2確認ルールを適用します。
ヴィタリク・ブテリンがクラウドアクセスなしで自己主権AIシステムを運用する方法
Buterinは、このシステムを「自己主権/ローカル/プライベート/セキュア」と説明し、それがAI agent分野で広がっている深刻なセキュリティとプライバシーの失敗への直接的な対応として構築されたと述べました。彼は、エージェントのスキルやプラグインツールの約15%が悪意のある指示を含んでいることを示す研究を指摘しました。セキュリティ企業Hiddenlayerは、1つの悪意のあるウェブページを解析することで、Openclawインスタンスを完全に侵害し、ユーザーの認識なしにシェルスクリプトをダウンロードして実行できることを実証しました。
「エンドツーエンド暗号化の一般化とますます多くのローカルファーストソフトウェアによって、私たちがついにプライバシーにおいて一歩前進したところだったのに、今や十歩も後退しようとしているという深い恐怖から私は発言しています,」とブテリンは書いた。
彼が選んだハードウェアは、Nvidia 5090 GPUを搭載し、ビデオメモリが24GBのラップトップです。このセットアップでは、AlibabaのオープンウェイトQwen3.5:35Bモデルをllama-server経由で実行し、90トークン/秒の速度を達成しました。これはButerinが快適な日常利用の目標と呼ぶ速度です。彼は128GBの統合メモリを搭載したAMD Ryzen AI Max Proをテストし、51トークン/秒を記録しました。また、DGX Sparkでは60トークン/秒に達しました。
彼は、デスクトップAIスーパーコンピューターとして販売されているDGX Sparkが、高価でありながら優れたラップトップGPUと比較してスループットが低いことから、印象に残らなかったと述べた。彼のオペレーティングシステムでは、ButerinはArch LinuxからNixOSに切り替え、これによりユーザーはシステム全体の設定を1つの宣言的ファイルで定義できるようにした。彼はllama-serverをバックグラウンドのデーモンとして使用し、任意のアプリケーションが接続できるローカルポートを公開している。
Claude Codeは、Anthropicのサーバーではなく、ローカルのllama-serverインスタンスを指し示すことができると彼は指摘した。サンドボックス化は、彼のセキュリティモデルの中心である。彼はbubblewrapを使用して、単一のコマンドで任意のディレクトリから隔離された環境を構築する。これらのサンドボックス内で実行されるプロセスは、明示的に許可されたファイルと制御されたネットワークポートへのみアクセスできる。Buterinは、github.com/vbuterin/messaging-daemonでsignal-cliとメールをラップするメッセージングデーモンをオープンソース化した。
彼は、デーモンがメッセージを自由に読み取り、確認なしに自分自身にメッセージを送信できることを指摘した。第三者への送信メッセージには明示的な人間の承認が必要である。彼はこれを「人間 + LLM 2-of-2」モデルと呼び、同じロジックがEthereumウォレットにも適用されると述べた。彼は、AI接続ウォレットツールを構築するチームに対して、自動取引を1日あたり100ドルに制限し、それ以上の金額やデータを外部に漏洩する可能性のあるcalldataを含む取引については人間の確認を必須とすることを勧めた。
Buterinの条件でのリモート推論
研究タスクのために、ブテリンは、ローカルツールLocal Deep Researchと、piエージェントフレームワークと自己ホスト型のプライバシー重視のメタ検索エンジンSearXNGを組み合わせた自身のセットアップを比較しました。彼は、piとSearXNGの組み合わせの方が高品質な回答を生成すると述べました。彼は、外部検索クエリへの依存を減らすために、約1テラバイトのローカルWikipediaダンプと技術ドキュメントを保存しており、外部検索クエリはプライバシーの漏洩と見なしています。
彼はまた、github.com/vbuterin/stt-daemon にローカルの音声トランスクリプションデーモンを公開しました。このツールは基本的な使用時にGPUなしで動作し、出力をLLMに送信して修正および要約を行います。Ethereumの統合に関して、ButerinはAIエージェントが無制限のwalletアクセスを保持すべきではないと述べました。彼は、人間とLLMをそれぞれ異なる失敗モードを検出する2つの独立した確認要因として扱うことを推奨しました。
ローカルモデルが不足する場合、ブテリンはリモート推論のプライバシー保護アプローチを示した。彼は、研究者ダビデとともに提案した自身のZK-API、Openanonymityプロジェクト、およびIPアドレスによって連続するリクエストをサーバーがリンクするのを防ぐためのミクスネットの使用を挙げた。また、短期的には信頼できる実行環境を用いることでリモート推論からのデータ漏洩を減らすことができると指摘しつつ、プライベートクラウド推論のための完全準同型暗号化は現在依然として実用的なほど速くないと述べた。
バテリンは、この投稿が完成品ではなく出発点を示していること、そして彼のツールをそのままコピーして安全であると仮定しないよう読者に注意を促した。

