AMD envoie le MI300X à Tiny Corp, le fondateur défie la domination de NVIDIA sur CUDA

iconMetaEra
Partager
AI summary iconRésumé
AMD a envoyé à la start-up tiny corp ses cartes d'accélération AI de pointe MI300X, dont le fondateur, George Hotz, avait débloqué l'iPhone à l'âge de 17 ans. Hotz estime que le mur de protection de NVIDIA autour de CUDA n'est pas infranchissable ; il a développé, avec environ 20 000 lignes de code, la pile d'apprentissage profond open source tinygrad, visant à contester l'écosystème CUDA du côté logiciel. Au mois de mai 2026, la capitalisation boursière de NVIDIA était environ sept fois celle d'AMD, une différence réduite par rapport aux 16 fois observées un an plus tôt. tiny corp vend également des ordinateurs Tinybox basés sur du matériel AMD, dans le but de rendre la puissance de calcul une marchandise.

Auteur et source de l'article : Nouvelle Intelligence

En mars 2025, George Hotz a publié un article sur son blog personnel dont le titre ne contenait que deux mots : AMD YOLO, signifiant « pas de retraite possible, tout miser sur AMD ».

Hotz a écrit dans l'article : AMD envoie les deux MI300X (les cartes d'accélération AI de centre de données les plus performantes d'AMD) que nous avons demandées ; elles sont déjà en route.

Le MI300X est le produit phare d'AMD pour son pari sur la puissance de calcul IA, habituellement en forte demande auprès des fournisseurs de cloud et des grandes entreprises de modèles. Il va désormais être envoyé à tiny corp : une petite entreprise qui n'avait même pas de bureau et qui fonctionnait uniquement via GitHub et Discord.

Le destinataire de ce colis, connu dans le milieu sous le nom de geohot — George Hotz.

Geohot est devenu célèbre pour la première fois en 2007 avec une vidéo. À l'âge de 17 ans, il a déverrouillé un iPhone pour la première fois.

En 2007, George Hotz, âgé de 17 ans, a présenté devant la caméra le premier iPhone débloqué au monde ; la vidéo a été visionnée près de deux millions de fois, faisant connaître le nom de geohot dans le monde du hacking.

Par la suite, il a été poursuivi en justice pour avoir piraté la PS3 de Sony. Cette fois-ci, il souhaite accomplir un projet encore plus ambitieux : miner depuis le logiciel le mur de protection de NVIDIA CUDA.

« CUDA est un écosystème, pas un fossé protecteur »

« CUDA est un écosystème, pas un fossé protecteur. »

Hotz a déclaré sans ambages dans son blog que CUDA (la plateforme de calcul GPU de NVIDIA) n'est pas le fossé protecteur que l'on imagine, mais simplement un écosystème précoce.

Il a publié une capture d'écran Twitter sur son blog. Déjà en janvier 2025, il avait qualifié l'envoi de puces AMD de « test culturel » : voir si AMD était disposée à investir dans le logiciel.

Dans cet article de blog de mars, il a conclu que AMD avait réussi l'épreuve. Il croyait qu'AMD ne abandonnerait pas le logiciel, et dans ce cas, NVIDIA n'aurait aucune raison d'être 16 fois plus cher qu'AMD.

Cela signifie qu'à l'époque, la capitalisation boursière de NVIDIA était environ 16 fois celle d'AMD, alors que les performances matérielles des deux entreprises n'étaient pas aussi éloignées. AMD a même mis au point des Tensor Cores à débit double sur son architecture RDNA4, tandis que NVIDIA a artificiellement réduit de moitié les performances sur ses propres cartes.

D’où vient cet écart de 16 fois ? La réponse de Hotz est le logiciel. Plus précisément, la complexité du logiciel et l’ancrage écologique issu de cette complexité.

Les développeurs sont habitués à CUDA, et les outils sont conçus autour de CUDA ; même si le matériel AMD est excellent, personne ne veut y toucher. Ce qui bloque AMD, ce n'est pas la puce, mais l'absence d'une pile logicielle compétitive.

Bien sûr, il s'agit de l'analyse de Hotz, et non d'une conclusion officielle d'AMD.

Il n'a pas seulement parlé, il a également investi 250 000 dollars américains dans AMD, exprimant publiquement un avis haussier et pariant sur cinq ans. Il a écrit sur son blog :

Soit NVIDIA est fortement surévalué, soit AMD est fortement sous-évalué.

Hotz a écrit cela en mars 2025, la capitalisation boursière de NVIDIA était environ 16 fois celle d'AMD.

D'ici mai 2026, la capitalisation boursière de NVIDIA s'élève à environ 5,2 billions de dollars américains, contre environ 760 milliards de dollars américains pour AMD, réduisant l'écart à environ 7 fois. Au cours de cette année, le cours de l'action AMD a fortement augmenté, soutenu par la demande croissante en centres de données AI, dépassant largement la hausse de NVIDIA.

Bien sûr, cela ne prouve pas que Hotz a raison. La réévaluation d'AMD provient principalement de ses propres livraisons de GPU et de ses résultats financiers, mais la direction du sentiment du marché confirme effectivement le jugement de Hotz : l'écart de 16 fois n'est pas aussi solide qu'on le pensait.

De la déverrouillage de l'iPhone à la défi de l'hégémonie du hashpower

Un programmeur qui n’a jamais conçu de puce, pourquoi ose-t-il défier NVIDIA ? L’histoire commence lorsqu’il avait 17 ans.

Été 2007, Apple a lancé le premier iPhone, exclusivement lié à AT&T. Hotz, âgé de 17 ans et utilisateur de T-Mobile, voulait un iPhone sans changer d'opérateur, alors il a décidé de démonter l'appareil.

Selon The New Yorker, il a dévissé le couvercle arrière avec un tournevis, trouvé le processeur de base qui limitait l'opérateur, soudé un fil pour lui injecter une tension et perturber son code. Le matin suivant, il a déclaré face à la caméra : « C'est le premier iPhone débloqué au monde. »

La vidéo a généré près de deux millions de vues, le rendant le hacker le plus célèbre au monde à l'époque. Deux ans plus tard, il s'est attaqué à la PlayStation 3 de Sony, en contournant la console de jeu réputée inviolable, avant d'être poursuivi par Sony et de régler l'affaire à l'amiable.

En 2011, Sony a poursuivi George Hotz pour avoir piraté la PS3 ; l'affaire s'est conclue par un règlement à l'amiable, Hotz ayant accepté une interdiction permanente et s'étant engagé à ne plus toucher aux produits Sony.

Hotz donne une définition simple du pirate : un pirate, c'est pour l'ordinateur ce qu'un plombier est pour les tuyaux.

Sa méthodologie n'a pas changé depuis des dizaines d'années : dans un système fermé, identifier la pièce capable de « dialoguer » avec vous, puis trouver un moyen de la faire obéir.

Réécriture de toute une pile AMD avec 20 000 lignes de code

L'iPhone et la PS3 ont démontré les compétences de Hotz.

Mais pour exploiter CUDA, une seule personne ne suffit pas ; il faut une véritable solution, c’est tinygrad. C’est une pile d’apprentissage profond open source pilotée par Hotz.

En réalité, l'obsession de Hotz pour « briser les systèmes fermés » s'est étendue bien au-delà de l'électronique grand public. En 2015, il a fondé l'entreprise d'automatisation automobile comma.ai, avec laquelle il a presque seul modifié une voiture dans son garage pour créer un système de conduite autonome capable de fonctionner sur autoroute, en direct concurrence avec Tesla.

Comma.ai est toujours en activité, et son modèle de conduite open source, openpilot, fonctionne sur tinygrad.

Le GitHub officiel le décrit comme un système end-to-end : incluant une bibliothèque de tenseurs, la dérivation automatique, l'IR (représentation intermédiaire) et le compilateur, ainsi que la compilation à la volée, l'exécution de graphes, et les composants d'optimisation et de chargement de données nécessaires à l'entraînement.

La caractéristique principale de ce système est sa « simplicité extrême ».

tinygrad prend déjà en charge plusieurs backends, notamment CUDA, AMD, METAL, QCOM et WEBGPU. Pour intégrer un nouveau matériel, d'autres solutions doivent maîtriser tout un ensemble complexe d'instructions ; avec tinygrad, il suffit que le nouveau matériel puisse exécuter les environ 25 opérations les plus basiques, comme l'addition, la soustraction, la multiplication et la division, pour être pris en charge.

Mais le véritable champ de bataille de Hotz est la ligne AMD.

En janvier 2025, tiny corp avait déjà écrit ses propres pilotes, environnement d'exécution, bibliothèques et simulateur. À ce moment-là, cette pile AMD comptait environ 12 000 lignes de code et ne manquait plus que l'assembleur RDNA3 pour être « entièrement autonome ».

En mars, Hotz a annoncé sur son blog que tiny corp disposait désormais d'une pile AMD complète, du matériel jusqu'à la couche PyTorch, avec pour seule exception le cadre de compilation LLVM.

Il a également ajouté : les développeurs n'ont même pas besoin d'apprendre à écrire avec tinygrad ; ils peuvent continuer à utiliser leur code PyTorch familier, tandis que la couche inférieure le convertit automatiquement en cette pile AMD.

12 000 lignes ne représentent que la taille de la pile AMD de la version de janvier 2025. Le projet tinygrad continue de croître ; à la version v0.13.0, il atteint 22 853 lignes, et Hotz a fourni en fin d'année 2025 un chiffre de 18 935 lignes sans les tests.

Mais que ce soit 12 000 ou 18 000, cela représente une comparaison étonnante dans le contexte de l'industrie.

Une pile logicielle capable de piloter une GPU et d'exécuter un entraînement compte souvent plusieurs millions de lignes. Selon Hotz, tinygrad est 1000 fois plus petite.

Cela signifie que la complexité de CUDA n'est pas fondée sur des lois physiques. Elle peut être réécrite par une petite équipe avec une approche minimaliste, ce qui est précisément ce en quoi Hotz croit.

Tinybox met une machine de calcul sur l'étagère

Si l'histoire s'arrêtait ici, tinygrad ne serait qu'un projet sur GitHub, mais l'ambition de Hotz va au-delà du code.

Tiny Corp vend officiellement un ordinateur appelé Tinybox. Sur son site officiel, les modèles red, green, pro et exa sont affichés, avec toutes les spécifications, prix et informations d'expédition clairement listés. Les commandes sont expédiées dans la semaine suivant le paiement.

Tinybox a déjà été comparé, dans le benchmark MLPerf Training 4.0, à des machines coûtant environ dix fois plus cher. Selon Hotz dans son blog de fin 2025, cette ligne de produits informatiques génère environ 2 millions de dollars de revenus par an, qu'il utilise pour financer l'ensemble des activités de recherche et développement de tiny corp.

Dans le même billet de blog, Hotz a également mentionné qu'ils ont signé un contrat avec AMD pour utiliser le MI350X afin d'entraîner Llama 405B sur MLPerf, et que les négociations de ce contrat ont essentiellement eu lieu publiquement sur Twitter.

Tiny Corp a résumé sa mission en une phrase : commoditize the petaflop.

Petaflop est une unité de puissance de calcul, équivalente à un million de milliards (10^15) opérations en virgule flottante par seconde, couramment utilisée pour mesurer la puissance des supercalculateurs et des systèmes d'IA.

Ce que Hotz souhaite faire, c'est de commercialiser les petaflops par seconde, afin que tout le monde puisse utiliser l'IA.

Lorsque la puissance de minage peut être tarifée, commandée et livrée en une semaine comme un appareil électronique grand public, le récit de la « rareté de la puissance de minage » pourrait bien s’effriter.

Une nouvelle route

La signification de l'histoire de Hotz ne réside pas dans un point fort tel que « un pirate informatique affronte NVIDIA et met fin à CUDA ». CUDA reste aujourd'hui encore l'option par défaut pour la majorité des développeurs.

Ce qui compte vraiment, c’est l’hypothèse sur laquelle Hotz a parié : la complexité de la pile logicielle d’IA peut être réduite à un niveau extrêmement faible. Dès qu’elle sera prouvée valide, la partie de la valorisation d’NVIDIA soutenue par CUDA devra être réévaluée.

Et ce pari n'est plus l'affaire de Hotz seul. Dans son article de fin 2025 intitulé « Five Years of tinygrad », il a écrit : « Le premier commit de code a été effectué en octobre 2020 ; cinq ans plus tard, l'entreprise compte désormais six personnes, et plusieurs ont consacré des années à ce projet. »

Pour Hotz, les problèmes matériels d'AMD ne sont pas majeurs ; l'essentiel réside dans le logiciel. Il s'agit d'un jugement d'entrepreneur, pas d'une déclaration officielle d'AMD. Dans la prime de capitalisation boursière de 16 fois d'NVIDIA, quelle part est attribuable au matériel et quelle part à ce mur logiciel en cours de déconstruction ligne par ligne ?

Hotz a fixé une échéance à son pari de 250 000 dollars : revenir dans cinq ans.

On ne sait pas encore si ce pari sera considéré comme un délire de pirate ou le point de départ d’une nouvelle voie. Mais l’épaisseur du fossé de puissance de calcul est déjà en train d’être redéfinie par certains à l’aide de code.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.