Vitalik Buterin fait fonctionner sa propre pile d'IA sur un ordinateur portable, et il pense que vous devriez envisager de faire de même. Dans un billet de blog du 2 avril, le cofondateur d'Ethereum a présenté un plan détaillé pour faire fonctionner des modèles de langage de grande taille entièrement localement, sans aucune dépendance envers les fournisseurs de cloud, leurs conditions d'utilisation ou leurs pipelines de collecte de données.
La configuration n’est pas simplement une expérience de pensée. Buterin utilise activement des modèles à poids ouverts comme Qwen3.5:35B sur un ordinateur portable NVIDIA 5090, atteignant environ 90 tokens par seconde. C’est suffisamment rapide pour une utilisation conversationnelle en temps réel, ce qui rend l’argument du « IA locale » plus qu’aspirational.
Le matériel et la pile
Buterin a testé sa configuration sur plusieurs machines. Le laptop NVIDIA 5090 s'est révélé le plus rapide, mais il a également exécuté la configuration sur un AMD Ryzen AI Max Pro doté de 128 Go de mémoire unifiée, qui a atteint 51 tokens par seconde. Il a également testé un DGX Spark.
La pile logicielle est tout aussi réfléchie. Buterin utilise NixOS pour des configurations système reproductibles, ce qui permet de reconstruire entièrement l’environnement de manière identique à partir d’un fichier de spécification. Il utilise llama-server pour héberger les modèles localement et des sandboxes bubblewrap pour isoler les processus les uns des autres et du système global.
La configuration de Buterin inclut un démon de messagerie personnalisé qui exige une confirmation humaine avant d'exécuter toute commande sensible. L'IA peut suggérer des actions, mais un humain doit les approuver avant que quoi que ce soit n'atteigne le monde réel.
Pourquoi l'autosouveraineté compte maintenant
Buterin construit vers cette vision depuis début 2024, lorsqu'il a commencé à souligner publiquement la nécessité d'outils d'IA fiables et privés.
Un élément du billet de blog se démarque : environ 15 % des « compétences » d’IA, les capacités modulaires que les agents utilisent pour effectuer des tâches, pourraient contenir du code malveillant. Ce n’est pas une évaluation de risque hypothétique. C’est un avertissement selon lequel l’écosystème actuel d’agents, où les utilisateurs téléchargent et exécutent des plugins tiers avec une auditation minimale, est structurellement vulnérable.
Le pari Ethereum AI
Au-delà de la configuration personnelle, Buterin a fait une suggestion plus large qui pourrait avoir des implications durables pour l’écosystème Ethereum. Il a appelé au développement de modèles d’IA spécifiquement affinés pour les cas d’utilisation d’Ethereum.
Les modèles affinés sont formés sur des données spécifiques au domaine, ce qui leur permet de comprendre les particularités d'Ethereum : son architecture EVM, ses normes de jetons, ses schémas de gouvernance, et la manière dont ses protocoles DeFi s'assemblent entre eux. Un modèle généraliste peut répondre à des questions sur Ethereum. Un modèle affiné peut raisonner à son sujet.
La vision de Buterin positionne Ethereum non seulement comme une blockchain, mais comme une couche économique et de coordination pour des agents d'IA décentralisés. Si les agents doivent effectuer des transactions, vérifier des identités ou coordonner entre eux dans des environnements sans confiance, l'infrastructure existante d'Ethereum, ses contrats intelligents, l'identité décentralisée et l'argent programmable deviennent le substrat naturel.
Aucun nouveau token ou protocole n'a été lancé en même temps que l'article de blog. Il s'agit d'une réflexion au niveau de l'infrastructure, et non d'une annonce produit.

