OpenAI et Broadcom s'associent pour développer des accélérateurs AI optimisés pour les LLM de 10 gigawatts

OpenAI a terminé de louer son avenir à Nvidia. L'entreprise a annoncé un partenariat avec Broadcom pour développer des accélérateurs AI sur mesure spécifiquement optimisés pour les grands modèles linguistiques, avec une déploiement ciblé s'étendant du second semestre 2026 à la fin de 2029.

L'échelle est impressionnante : 10 gigawatts d'accélérateurs AI sur mesure.

À quoi ressemble réellement ce partenariat

La répartition des tâches ici est claire. OpenAI gère la conception des accélérateurs, intégrant directement sa compréhension approfondie des charges de travail des LLM dans l'architecture silicium. Broadcom prend en charge le développement, la fabrication et le déploiement de ces systèmes, en les intégrant à sa propre technologie de réseau Ethernet.

Ce n’est pas la première fois qu’OpenAI s’intéresse aux puces sur mesure. Des rapports ont fait surface en septembre 2025 indiquant que l’entreprise collaborait avec Broadcom sur une puce accélératrice « XPU » prévue pour une production en 2026. L’annonce du 13 octobre confirme et élargit considérablement cet effort.

« Développer nos propres accélérateurs contribue à l’écosystème plus large », a déclaré Sam Altman, PDG d’OpenAI.

Le PDG de Broadcom, Hock Tan, a exprimé cette ambition de manière plus directe, décrivant l'objectif comme étant de « co-développer et déployer 10 gigawatts d'accélérateurs de prochaine génération ».

Les installations seront déployées dans les propres installations d'OpenAI et les centres de données affiliés.

Pourquoi OpenAI a besoin de son propre silicium

OpenAI aurait plus de 800 millions d'utilisateurs actifs hebdomadaires utilisant ses services d'IA basés sur le cloud. Faire fonctionner des modèles de langage à cette échelle est extrêmement coûteux, et les accélérateurs sur mesure permettent à OpenAI d'intégrer directement ses connaissances architecturales dans le matériel — au lieu d'écrire un logiciel qui contourne les limites d'une puce, vous concevez la puce en fonction des besoins exacts de votre logiciel.

C'est le même jeu que Google a joué avec ses puces TPU (Tensor Processing Unit). Amazon a suivi avec ses puces Trainium et Inferentia pour AWS. Microsoft dispose de ses accélérateurs Maia.

Ce que cela signifie pour le paysage concurrentiel

L'intégration du réseau Ethernet de Broadcom est un détail significatif. L'inférence IA à grande échelle ne se limite pas à des puces rapides — il s'agit aussi de déplacer les données entre les puces de manière efficace. En combinant son expertise en réseau avec les conceptions d'accélérateurs d'OpenAI, Broadcom peut offrir une solution end-to-end.

Le calendrier de déploiement 2026-2029 est important pour toute personne modélisant les finances d'OpenAI. Les puces personnalisées prennent du temps à générer des retours, mais une fois opérationnelles, elles pourraient réduire considérablement les coûts informatiques par requête d'OpenAI. Avec 800 millions d'utilisateurs actifs hebdomadaires et en croissance, même de modestes gains d'efficacité par inférence se traduisent par des économies mesurées en milliards par an.