La plateforme Vera Rubin de Nvidia, la successeure de l'architecture déjà dominante Blackwell, devrait stimuler la demande de serveurs IA au second semestre 2026.
Le chiffre d'affaires de l'entreprise pour l'exercice 2026 a atteint 215,9 milliards de dollars, soit une augmentation de 65 % sur un an, entièrement stimulée par la demande en GPU pour l'IA. Rubin est la gamme de produits conçue pour garantir que cette trajectoire de croissance ne s'aplanisse pas.
Ce que Rubin apporte réellement à la table
Nvidia affirme que la plateforme Rubin permettra de réduire les coûts des jetons d'inférence de 10 fois par rapport à Blackwell. Du côté de l'entraînement, Rubin devrait nécessiter 4 fois moins de GPU pour entraîner des modèles mixture-of-experts par rapport à Blackwell. La performance par watt s'améliore jusqu'à 50 fois par rapport à la génération actuelle de Blackwell.
Le PDG Jensen Huang a positionné Rubin comme un supercalculateur AI NVLink de troisième génération, le présentant comme un contributeur essentiel à ce qu'il décrit comme un investissement mondial de 3 à 4 billions de dollars dans la construction d'une usine AI.
Calendrier de production et de déploiement
Les GPU Rubin sont actuellement en production chez TSMC, avec six nouveaux puces ciblées pour la production de masse au second semestre 2026.
AWS, Google Cloud et Microsoft Azure préparent tous à intégrer des instances basées sur Rubin sur leurs plateformes au cours de la même fenêtre du H2 2026. Microsoft, en particulier, préparerait déployer des centaines de milliers de systèmes basés sur Rubin.
Ce que cela signifie pour les investisseurs
La montée en puissance du deuxième semestre 2026 de la plateforme Rubin a des implications directes sur plusieurs segments du marché au-delà de Nvidia lui-même. La capacité de conditionnement avancé et de fabrication de TSMC fera face à une autre vague de demande, ce qui pourrait resserrer l'offre pour d'autres concepteurs de puces en concurrence pour les mêmes créneaux de production.
La série MI d'AMD et les silices personnalisées de Google (TPU) et d'Amazon (Trainium) ciblent tous les mêmes charges de travail. Mais l'écosystème logiciel de Nvidia, CUDA, reste le fossé que les concurrents n'ont pas encore franchi.
Le risque à surveiller est l'exécution. Lancer simultanément six nouveaux puces en production de masse est ambitieux. Tout retard chez TSMC, tout problème de rendement, tout incident dans la chaîne d'approvisionnement de l'interconnect NVLink pourrait repousser les échéances à 2027 et ouvrir une fenêtre aux concurrents.
