La domination de Nvidia sur le calcul IA repose depuis longtemps sur deux piliers : son matériel et son logiciel. Les GPU attirent toute l'attention, mais le verrouillage réel provient de CUDA, la plateforme de programmation propriétaire autour de laquelle des millions de développeurs ont construit leurs flux de travail. OpenAI lance désormais une attaque directe contre ce deuxième pilier.
L'entreprise prépare le lancement d'un outil conçu pour permettre aux modèles d'IA de fonctionner sur du matériel autre qu'Nvidia, en utilisant son langage open-source Triton comme alternative viable à CUDA.
L'évolution silencieuse de Triton
Triton n'est pas nouveau. OpenAI l'a initialement publié en juillet 2021 comme un langage open-source pour écrire des noyaux GPU haute performance en Python. La proposition était simple. CUDA est puissant mais notoriously complexe. Triton vise à offrir des performances comparables avec un code bien plus accessible pour le développeur moyen.
Depuis lors, le projet a continué de gagner en popularité. Il sert désormais de backend à des frameworks populaires comme PyTorch. La dernière version, Triton 3.7, a été publiée en 2026, ce qui indique qu'OpenAI ne traite pas ce projet comme un projet secondaire.
La stratégie de diversification matérielle
La poussée logicielle d'OpenAI n'existe pas dans un vide. L'entreprise explore activement des alternatives aux puces Nvidia depuis 2025, en partie en raison de mécontentement face à certaines puces d'inférence de Nvidia. L'inférence est le processus consistant à exécuter un modèle d'IA déjà formé, contrairement à son apprentissage initial.
L'entreprise a annoncé un partenariat avec AMD incluant une capacité de calcul importante de 6 GW alimentée par AMD. OpenAI a décrit cela comme complémentaire à ses engagements existants avec Nvidia, et non comme un remplacement.
Au-delà d'AMD, OpenAI a entretenu des discussions avec des startups comme Cerebras et Groq, qui ont toutes deux conçu des puces spécialisées optimisées pour les charges de travail d'inférence. L'entreprise poursuit également le développement de puces d'inférence AI sur mesure avec Broadcom, avec des plans de production prévus pour 2026.
Ce que cela signifie pour les investisseurs
L'écosystème CUDA de Nvidia compte des millions de développeurs, des années de connaissances institutionnelles et une intégration approfondie dans presque tous les principaux frameworks d'IA.
AMD améliore sa plateforme ROCm pour augmenter la compatibilité avec les charges de travail IA. Des projets ouverts comme ZLUDA sont apparus pour traduire le code CUDA afin de l'exécuter sur du matériel non Nvidia. Et maintenant, le plus grand consommateur mondial de puissance de calcul IA développe activement des outils pour rendre l'avantage logiciel de Nvidia moins pertinent.
Pour AMD et l'écosystème plus large de puces alternatives, les initiatives d'OpenAI représentent un point de bascule potentiel. La principale barrière à l'adoption des matériels autres que Nvidia a toujours été la compatibilité logicielle. Si Triton devient un standard véritablement multi-plateformes, il élimine l'objection la plus importante que les développeurs d'IA ont lorsqu'ils envisagent AMD ou des puces personnalisées.
