El cofundador de Ethereum, Vitalik Buterin, ha dejado por completo los servicios de IA en la nube y detalló su configuración de inteligencia artificial (IA) completamente local y en entorno aislado en una entrada de blog publicada esta semana.
Principales conclusiones:
- El cofundador de Ethereum, Vitalik Buterin, abandonó la IA en la nube en abril de 2026, ejecutando Qwen3.5:35B localmente en una laptop Nvidia 5090 a 90 tokens por segundo.
- Buterin descubrió que aproximadamente el 15% de las habilidades de los agentes de IA contienen instrucciones maliciosas, citando datos de la empresa de seguridad Hiddenlayer.
- Su demonio de mensajería de código abierto exige una regla de confirmación 2 de 2 (humano + LLM) para todas las acciones salientes de Signal y correo electrónico a terceros.
Cómo Vitalik Buterin ejecuta un sistema de IA autosoberana sin acceso a la nube
Buterin describió el sistema como “autónomo / local / privado / seguro” y dijo que fue desarrollado como respuesta directa a lo que él considera graves fallas de seguridad y privacidad que se extienden por el espacio de los agentes de IA. Señaló investigaciones que muestran que aproximadamente el 15% de las habilidades de los agentes, o herramientas de complemento, contienen instrucciones maliciosas. La empresa de seguridad Hiddenlayer demonstró que analizar una sola página web maliciosa podría comprometer completamente una instancia de Openclaw, permitiéndole descargar y ejecutar scripts de shell sin el conocimiento del usuario.
“Vengo de una mentalidad de tener mucho miedo de que, justo cuando finalmente estábamos dando un paso adelante en privacidad con la normalización del cifrado de extremo a extremo y cada vez más software primero local, estemos al borde de dar diez pasos atrás,” escribió Buterin.
Su hardware de elección es una laptop con una GPU Nvidia 5090 con 24 GB de memoria de video. Al ejecutar el modelo Qwen3.5:35B de Alibaba con pesos abiertos a través de llama-server, el sistema alcanza 90 tokens por segundo, lo que Buterin considera el objetivo para un uso diario cómodo. Probó el AMD Ryzen AI Max Pro con 128 GB de memoria unificada, que alcanzó 51 tokens por segundo, y el DGX Spark, que llegó a 60 tokens por segundo.
Dijo que el DGX Spark, comercializado como una supercomputadora de escritorio de IA, fue poco impresionante dado su costo y menor rendimiento en comparación con una buena GPU de portátil. Para su sistema operativo, Buterin cambió de Arch Linux a NixOS, que permite a los usuarios definir toda la configuración del sistema en un único archivo declarativo. Usa llama-server como un demonio en segundo plano que expone un puerto local al que cualquier aplicación puede conectarse.
Claude Code, señaló, puede apuntar a una instancia local de llama-server en lugar de los servidores de Anthropic. El aislamiento es central en su modelo de seguridad. Utiliza bubblewrap para crear entornos aislados desde cualquier directorio con un solo comando. Los procesos que se ejecutan dentro de esos entornos aislados solo pueden acceder a archivos explícitamente permitidos y puertos de red controlados. Buterin abrió el código de un demonio de mensajería en github.com/vbuterin/messaging-daemon que envuelve signal-cli y email.
Él señaló que el demonio puede leer mensajes libremente y enviarse mensajes a sí mismo sin confirmación. Cualquier mensaje saliente a un tercero requiere aprobación humana explícita. Él llamó a esto el modelo "humano + LLM 2-de-2", y dijo que la misma lógica se aplica a los monederos Ethereum. Aconsejó a los equipos que desarrollan herramientas de monedero conectadas a IA que limiten las transacciones autónomas a $100 por día y requieran confirmación humana para cualquier cantidad superior o cualquier transacción que lleve calldata que pueda exfiltrar datos.
Inferencia remota, según los términos de Buterin
Para tareas de investigación, Buterin comparó la herramienta local Local Deep Research con su propia configuración que utiliza el marco pi agent junto con SearXNG, un motor de búsqueda meta autohospedado centrado en la privacidad. Dijo que pi más SearXNG produjo respuestas de mejor calidad. Almacena una copia local de Wikipedia de aproximadamente 1 terabyte junto con documentación técnica para reducir su dependencia de búsquedas externas, que considera una fuga de privacidad.
También publicó un demonio de transcripción de audio local en github.com/vbuterin/stt-daemon. La herramienta funciona sin GPU para uso básico y envía la salida al LLM para corrección y resumen. Sobre la integración con Ethereum, Buterin dijo que los agentes de IA nunca deberían tener acceso ilimitado al monedero. Recomendó tratar al humano y al LLM como dos factores de confirmación distintos que detectan diferentes modos de fallo.
Para los casos en los que los modelos locales no son suficientes, Buterin describió un enfoque que preserva la privacidad para la inferencia remota. Se refirió a su propia propuesta ZK-API con el investigador Davide, al proyecto Openanonymity y al uso de mixnets para evitar que los servidores vinculen solicitudes sucesivas por dirección IP. También citó los entornos de ejecución confiables como una forma de reducir la fuga de datos en la inferencia remota a corto plazo, mientras señaló que la encriptación completamente homomórfica para la inferencia en la nube privada sigue siendo demasiado lenta para ser práctica hoy en día.
Buterin cerró con una nota que indica que la publicación describe un punto de partida, no un producto final, y advirtió a los lectores que no copien sus herramientas exactas ni asuman que son seguras.

