Le PDG de Nvidia, Jensen Huang, a déclaré que la plateforme Vera Rubin de nouvelle génération de l'entreprise est déjà en « production complète », révélation de nouveaux détails au CES à Las Vegas sur un matériel qu'il affirme capable de fournir cinq fois plus de calculs d'intelligence artificielle que les systèmes précédents d'Nvidia.
Rubin devrait arriver plus tard cette année et vise directement la partie en croissance la plus rapide du secteur de l'IA, en aidant à produire les résultats issus des modèles entraînés.
Huang a déclaré que le serveur phare de Rubin inclura 72 unités de traitement graphique d'Nvidia et 36 processeurs centraux, et pourra être relié à des « pods » plus importants contenant plus de 1 000 puces Rubin.
Beaucoup des discussions portaient sur l'efficacité. Huang a déclaré que les systèmes Rubin pouvaient améliorer l'efficacité de la génération de « tokens » d'IA — les unités de base produites par les modèles de langage — d'environ dix fois, grâce à un type de données propriétaire que l'entreprise souhaite voir adopter par l'industrie dans son ensemble. Il a ajouté que cette amélioration des performances intervient malgré une augmentation de seulement 1,6 fois du nombre de transistors.
Huang a décrit le développement de l'IA comme une course où un traitement plus rapide signifie atteindre l'étape suivante plus tôt, forçant les concurrents à dépenser agressivement pour les puces, le réseau et le stockage.
Cette même course à l'infrastructure a également transformé certaines parties du marché de la cryptomonnaie.
Les mineurs de Bitcoin se sont de plus en plus présentés en tant qu'opérateurs d'énergie et d'espace serveur plutôt qu'en tant que simples investissements cryptographiques, proposant leurs contrats énergétiques, leur capacité de refroidissement et leurs empreintes de centres de données à leurs clients dans le domaine de l'IA.
L'hébergement des charges de travail d'IA peut générer des flux de trésorerie plus stables que l'extraction du bitcoin pendant les phases baissières, en particulier pour les entreprises disposant d'une énergie bon marché, de sites existants et d'une capacité de refroidissement.
Mais l'essor de l'IA relève aussi la barre. L'espace des centres de données devient un actif précieux, et les meilleurs emplacements sont surenchérés par les hyperscalers, les entreprises de cloud et les startups d'IA.
Cela peut faire augmenter les loyers, les coûts d'équipement et les difficultés de financement pour les mineurs plus petits. Autrement dit, les mineurs qui ressemblent à des entreprises d'infrastructures pourraient gagner, tandis que ceux qui s'appuient sur des marges de pure extraction minière devront faire face à une année 2026 plus difficile.
Pendant ce temps, Nvidia a également mis en évidence de nouveaux commutateurs réseau utilisant une méthode de connexion appelée optiques intégrées, une technologie clé pour relier des milliers de machines en un seul système.
L'entreprise a déclaré que CoreWeave serait parmi les premiers à recevoir les systèmes Rubin, et s'attend à ce que Microsoft, Oracle, Amazon et Alphabet les adoptent également.

