Conception du robot Isaac GR00T de NVIDIA et le parcours de l'OPI d'UST Robotics

À la fin de la conférence de Huang Renxun au Taipei Music Center, l'épilogue a été une robot qui est monté sur scène.

On ne sait pas exactement depuis quand les gens appellent les robots « végétatifs ». Peut-être parce qu’ils ne sont pas encore assez flexibles — dire cela semble aussi juste.

01

Regardez comment Jensen Huang présente ce robot : 1,80 m de hauteur, 68 kg de poids, 75 degrés de liberté dans tout le corps ; il a fait une blague sur scène en disant que cette taille et ce poids « sont à peu près les miens ». C’est assez intéressant.

Ce robot s'appelle Isaac GR00T ; la définition officielle de NVIDIA est un design de référence, avec trois fournisseurs chacun chargés d'une partie.

Le corps provient de Unitree H2 Plus, les mains sont les doigts agiles de Sharpa à Singapour, le cerveau est la puce Jetson Thor d'NVIDIA, accompagnée de toute la pile logicielle Isaac GR00T.

J'ai remarqué un détail :

Yingzi a déclaré que les utilisateurs cibles de cette conception de référence sont les établissements d'enseignement supérieur et les chercheurs universitaires ; les premiers clients incluent Stanford et l'École polytechnique fédérale de Zurich.

La plateforme de développement et le code du modèle seront bientôt disponibles sur GitHub et Hugging Face ; toute la pile logicielle est prête à l'emploi, réduisant le temps de préparation de l'équipe de recherche de plusieurs jours à quelques heures.

En d'autres termes, NVIDIA ne fait pas qu'un seul robot.

C'est un projet clé en main ; corps, cerveau, outils de génération de données, cadre d'entraînement et environnement de simulation, tout est inclus ; il vous suffit de le brancher pour commencer vos expériences.

I checked their data generation capabilities.

Yuko a déclaré qu'avec Cosmos 3 et le Blueprint Isaac GR00T, il est possible de générer 780 000 trajectoires de mouvement synthétiques en 11 heures. Que signifient 780 000 trajectoires ? Cela équivaut à 6 500 heures de données de démonstration humaine ; soit environ neuf mois de formation continue d'un ingénieur enseignant des mouvements à un robot.

Ensuite, cet après-midi, le comité d'examen de la bourse de Shanghai a annoncé les résultats : YuShu Technology a obtenu l'approbation pour son introduction en bourse et répond aux conditions d'émission.

73 jours, de la soumission à l'approbation, avec une collecte de 4,202 milliards, une valorisation globale de 42 milliards. La première entreprise chinoise sur le marché A à se consacrer aux robots humanoïdes est désormais confirmée ; je voudrais décrire ce double événement comme une double joie.

Mais un détail mérite d'être noté,

Dans le discours de Huang Renxun, le nom de Unitree apparaît dans la colonne « corps » ; Sharpa figure dans la colonne « main » ; NVIDIA occupe toute la section « cerveau, puissance de calcul, modèle, simulation, génération de données ».

L'après-midi, lors de l'examen à Shanghai, Unitree a obtenu une évaluation de 42 milliards de yuans. Le prospectus indique clairement que le plus grand montant des fonds levés sera alloué au modèle corporel à grande échelle. C'est le cerveau.

NVIDIA dit que tu es mon corps, le même jour, Unitree dit que je vais construire mon propre cerveau. Qu'est-ce qui se passe ?

02

J'ai inventé un mot, en m'inspirant du design. Ce mot est assez neutre, comme un document technique, un ensemble de solutions ; consultez-le comme référence.

Ce mot est apparu de nombreuses fois dans le monde de la technologie, et chaque fois, la suite des événements est à peu près la même.

Le cas le plus emblématique dans l'industrie mobile.

Autour de 2010, Qualcomm a commencé à faire une chose : elle a regroupé les puces Snapdragon, le modem, le système Android, les pilotes et les interfaces matérielles en une conception de référence complète pour smartphones.

Dans l'industrie, on l'appelle turnkey, ce qui se traduit par clé en main.

Que signifie cela ? Vous êtes un fabricant de téléphones portables, vous n’avez pas besoin de posséder vous-même des compétences en conception de puces ou en débogage de systèmes, ni de maintenir une équipe de recherche et développement matérielle. Avec la solution Qualcomm, trouvez un fabricant ODM, modifiez le boîtier, ajoutez votre logo, et voilà, votre téléphone est prêt.

C'est ainsi que la première génération de Redmi est née. À l'époque, Xiaomi avait confié la fabrication à Wingtech en utilisant la solution Qualcomm ; cette année-là, WINGTECH a livré 65,5 millions d'unités.

Cela semble être une situation gagnant-gagnant : Qualcomm a vendu des puces, les marques ont économisé sur la R&D, et les usines ODM ont obtenu des commandes.

Ensuite, j'ai vérifié ce qui s'est passé après.

Huaqin Technology, la plus grande entreprise ODM de téléphones portables en Chine, a généré un chiffre d'affaires supérieur à 70 milliards de yuans au cours des neuf premiers mois de 2024, avec un bénéfice net attribuable aux actionnaires de 2 milliards de yuans. Longqi Technology a enregistré un chiffre d'affaires de 35 milliards de yuans et un bénéfice net inférieur à 500 millions de yuans.

70 milliards de revenus, 2 milliards de bénéfices, un taux de marge nette inférieur à 3 %.

Les marges brutes de fabrication mobile de ces entreprises oscillent depuis longtemps entre 5 % et 11 %. Les professionnels du secteur appellent cela un revenu pénible ; coincés entre les fournisseurs de puces qui exercent une pression à la baisse, les marques qui comparent les prix en bas, et les concurrents qui intensifient la concurrence au milieu. Plus ils grandissent, plus leurs marges s'amincissent.

WenTai Technology, autrefois leader mondial des livraisons ODM, a effectué une action au début de 2025 : elle a vendu l'ensemble de son activité ODM à Luxshare Precision, se retirant complètement du contrat de fabrication de téléphones. Après cette vente, elle s'est entièrement orientée vers les semi-conducteurs, dont la marge brute atteint 37,47 %, soit plus de sept fois celle de la fabrication de téléphones.

Tu vois, être le meilleur au monde en matière de corps, puis choisir d'arrêter.

Quel est le lien avec aujourd'hui ? J'ai comparé ce que Qualcomm faisait à l'époque avec ce que NVIDIA fait aujourd'hui.

Qualcomm a sorti une puce, Android et un design de référence, que tout le secteur des téléphones portables a adoptés. Et le résultat ? Les appareils hardware sont devenus tous identiques, et les bénéfices ont progressivement migré des marques et des fabricants vers les fournisseurs de puces et d' systèmes d'exploitation.

NVIDIA a lancé aujourd'hui la puce Jetson Thor, le modèle Isaac GR00T et une conception de référence. Le code du modèle est entièrement open source, le cadre de simulation est également open source, et les outils de génération de données sont fournis en package.

J'ai consulté la liste actuelle des partenaires de NVIDIA : Unitree utilise Jetson Thor, Zhiyuan, Galaxy General et UBTECH l'utilisent également. Même Figure AI et Boston Dynamics l'utilisent, ainsi que Amazon et Meta.

Unitree est l'un des dizaines de fournisseurs de corps.

Le VP du département robotique de NVIDIA a dit : « Nous ne produisons pas de robots, ni ne fabriquons de voitures ; nous fournissons un soutien technologique à l’ensemble de l’industrie grâce à des infrastructures informatiques et des logiciels. »

This statement was made by Qualcomm in almost exactly the same form fifteen years ago.

Lorsqu'une entreprise déclare : « Nous ne développons pas de produits finaux, nous ne fournissons que des plateformes et des outils », elle annonce en réalité une chose : je fixe les règles.

Le modèle GR00T est open source, avec la même logique que celle utilisée par Google lorsqu'il a open-sourcé Android. Le logiciel vous est fourni gratuitement afin de vous rendre dépendant de mon matériel. En utilisant mon modèle et ma plateforme de simulation, vous devrez exécuter les processus sur mon puce.

Mon avis est le suivant :

En se référant à la conception, comme un accord de répartition des pouvoirs, celui qui publie la conception définit la valeur du cerveau et celle du corps dans cette industrie.

Le secteur des téléphones portables l'a déjà fait : une entreprise qui fabrique des corps, avec un chiffre d'affaires de 70 milliards de dollars et une marge inférieure à 3 % ; une entreprise qui fabrique le cerveau, qui génère des centaines de milliards de dollars par an uniquement grâce aux redevances de brevets. Et maintenant, par un heureux hasard, le secteur de la robotique a obtenu le même accord.

03

J'ai consulté le prospectus de Unitree. Sur les 4,2 milliards de yuans levés, 2,022 milliards seront investis dans le développement de modèles de robots intelligents, ce qui représente 48 %, soit la plus grande part de tous les projets ; 1,11 milliard sera alloué au développement des corps, 445 millions aux nouveaux produits et 624 millions à la construction de bases de fabrication.

L'endroit où l'on dépense le plus d'argent, c'est le cerveau. Unitree connaît certainement ce jeu.

Wang Xingxing a dit une fois que la plus grande erreur commise au cours des dix dernières années avait été de sous-estimer les progrès technologiques de l'IA ; son équipe s'était longtemps concentrée sur les ontologies et le contrôle du mouvement, et n'a commencé à renforcer ses efforts sur les grands modèles incarnés que ces deux dernières années.

Fournir des carcasses pour les conceptions de référence de NVIDIA tout en investissant 2 milliards de dollars pour construire son propre cerveau. C’est une guerre d’indépendance sous couvert de coopération.

J'ai vérifié les détails : le GR00T N1.5 d'NVIDIA fonctionne déjà sur le robot Unitree G1 ; les développeurs de la communauté open source ont directement déployé et effectué des démonstrations de tâches sur le G1 à l'aide du code. Un tutoriel de déploiement complet est disponible sur GitHub.

Autrement dit, le cerveau d'Eiko a été transféré dans le corps de Yushu. Et ce processus est public, accessible à tous pour être copié.

Que fait Natsuki lui-même ?

En septembre 2025, Unitree a open-sourced son modèle mondial interne UnifoLM-WMA-0. En janvier 2026, elle a publié le modèle vision-langage-action UnifoLM-VLA-0.

Le 25 mai, jour de la publication de l'annonce de la réunion, Unitree a lancé le modèle de langage embarqué WVLA 2.0, permettant au robot G1 de trier et ranger de manière autonome les objets d'une salle de réunion dans un environnement complexe avec des mouvements humains, sans aucune commande à distance.

Deux cerveaux, fonctionnant sur le même corps : l’un est celui de NVIDIA, open source, utilisable par le monde entier ; l’autre est celui d’Unitree, récemment lancé et encore en cours de rattrapage. Comment puis-je décrire cela ?

Il y a un autre rôle à surveiller.

J'ai découvert une entreprise appelée Zhongke Fifth Epoch, fondée en septembre 2024, dont l'équipe principale provient de l'Académie des sciences de Chine et de Tsinghua ; cette année, elle a levé trois rounds de financement consécutifs : Sequoia Capital China a mené le round Pre-A, et le dernier round A a été financé par Futeng Capital et Shanghai Semiconductor Industry Investment.

Il est le fournisseur n°001 de cerveau d'opération incarnée pour Unitree Technologies.

Les deux parties ont développé une solution intégrée logiciel-hardware sur la plateforme de robot humanoïde Unitree G1 pour l'industrie électrique ; Zhongke Wuji collabore également avec Midea, et ses robots sont déjà en fonctionnement sur les lignes de production de l'usine Midea à Foshan.

As-tu remarqué le problème ?

Le robot d'Unitree est équipé de trois cerveaux : le GR00T de NVIDIA, le UnifoLM développé en interne par Unitree, et la série FAM de Fifth Epoch.

Pourquoi une entreprise qui fait du corps doit-elle se connecter à trois cerveaux à la fois ? Parce qu'elle n'en a pas encore le sien.

Le taux de dépenses de recherche et développement de Unitree en 2025 est de 8,53 %, soit 145 millions ; son concurrent UBTECH est à 25 %, soit 507 millions. Unitree est l'une des entreprises leaders du secteur avec le taux de dépenses en recherche et développement le plus bas.

Ces 2 milliards sont les frais de rattrapage. Le problème, c’est qu’il y a une période limitée pour le rattrapage.

GR00T de NVIDIA est open source et évolue rapidement. Entre N1 et N1.5, il n'y a eu qu' moins de trois mois. Si GR00T est suffisamment pratique, de plus en plus de développeurs et de clients le choisiront par défaut.

Comme après le déploiement d'Android, il n'est pas impossible de créer votre propre système d'exploitation pour smartphone, mais cela devient de plus en plus difficile.

Ce que Yushu fait actuellement, c'est comme installer des puces Qualcomm sur des téléphones Android pour les vendre et gagner de l'argent, tout en travaillant discrètement en laboratoire sur ses propres puces et son propre système d'exploitation.

Je crois que l'état où deux cerveaux coexistent ne durera pas longtemps ; il n'y a que deux issues possibles : soit notre cerveau interne rattrapera le sien, rendant celui d'Yingzi inutile ; soit il ne le rattrapera pas, et le cerveau de NVIDIA deviendra le seul choix, auquel cas Yushu ne gardera plus que son corps.

04

À ce sujet, une question ne peut être évitée : quelqu’un utilise-t-il vraiment un cerveau autre qu’NVIDIA et gère-t-il tout par lui-même ?

Oui, une seule. Tesla. Et pour l'instant, seulement celle-ci.

Les puces utilisées dans le robot humanoïde Optimus sont les puces FSD développées par Tesla, les mêmes que celles installées dans les véhicules pour la conduite autonome.

Même pipeline d'entraînement, même système d'annotation des données, même architecture de réseau neuronal, directement transférés depuis la voiture. Le matériel d'inférence est également compatible ; il fonctionne actuellement sur HW4 et sera mis à niveau vers AI5 pour la prochaine génération.

J'ai vérifié les dernières informations ; lors de la conférence téléphonique sur les résultats du premier trimestre, Musk a confirmé plusieurs dates.

Optimus V3 sera lancé mi-année, et la ligne de production de l'usine de Fremont démarrera la production de masse en juillet et août. Cette ligne, issue de l'ancienne chaîne de production du Model S et du Model X, est actuellement en cours de transformation en ligne dédiée à Optimus après l'arrêt de la production en mai, avec un objectif de capacité annuelle de 1 million d'unités.

1 million unités. Unitree prévoit de livrer 5 500 robots humanoïdes en 2025.

180 fois moins.

En parallèle, la puce d'inférence AI5 de Tesla a été fabriquée avec succès, et son système d'approvisionnement en puces propriétaires est désormais en place ; cela signifie que, de l'entraînement à l'inférence, du cloud à l'extrémité robotique, aucune composante NVIDIA n'est présente sur toute la chaîne.

Je pense que Tesla a réussi cela grâce à trois atouts.

Première, la roue de données FSD. Des millions de Tesla circulent chaque jour sur les routes, renvoyant en continu des données visuelles du monde réel.

Ces données sont utilisées pour former les véhicules autonomes, ainsi que la perception et la prise de décision des robots ; l'équipe d'Optimus n'a pas besoin de collecter des données pour les robots à partir de zéro, car les données des véhicules peuvent être réutilisées.

Deuxième, puce développée en interne.

De Dojo à HW4 jusqu’à AI5, Tesla a toujours développé sa propre architecture de calcul. Bien que Dojo ait connu de nombreuses difficultés et que AI5 vienne tout juste d’être fabriqué, la direction n’a jamais changé : elle ne veut pas confier l’hardware de base de son cerveau à quelqu’un d’autre.

Troisième, la super usine.

Le système de fabrication utilisé par Tesla pour produire plus d'un million de véhicules peut être directement appliqué à la fabrication de robots ; la gestion de la chaîne d'approvisionnement, le contrôle de la qualité et l'augmentation de la capacité de production ne peuvent pas être achetés rapidement avec de l'argent.

En revenant en arrière sur Yushu, aucune de ces trois cartes n’a été jouée. Cela signifie-t-il que Yushu deviendra nécessairement Wentai ? Pas forcément.

Parce que Unitree détient une carte que Tesla n'a pas, le taux de conception et de production interne des composants principaux dépasse 90 %. Les moteurs, les réducteurs et les contrôleurs sont tous fabriqués en interne.

L'algorithme de contrôle du mouvement du robot quadrupède a été développé depuis zéro, et le robot humanoïde H1 a été mis en production six mois après le lancement du projet, avec seulement trois personnes à temps plein impliquées ; cela démontre que la technologie corporelle de Unitree est très avancée.

Il y a une différence cruciale que beaucoup ignorent lorsqu'ils font la comparaison entre le téléphone portable et les robots.

La forme physique des téléphones portables est devenue homogène.

Un écran, une puce, une batterie, un boîtier différent — c’est tout. Il y a presque aucune possibilité de différenciation matérielle. Dès qu’un fabricant de puces publie un design de référence, tous les téléphones deviennent identiques, et les marques ne peuvent plus compter que sur le marketing et les prix.

Les robots ne sont pas tous égaux : certains peuvent marcher avec stabilité, se tenir sur une seule jambe sans tomber même s’ils sont poussés, ou ouvrir un bocal avec cinq doigts — ces capacités présentent encore de grandes différences entre les entreprises aujourd’hui.

Cela signifie qu'au moins à ce stade, faire du body n'est pas forcément une impasse ; le body lui-même conserve encore un potentiel de prime et n'a pas encore été standardisé.

Cependant, de nouvelles tendances émergent dans l'industrie. J'ai remarqué une tendance selon laquelle la demande pour des puces d'intelligence incarnée passe de l'achat de produits standards à des SoC personnalisés et dédiés.

Cela signifie que, à l'avenir, chaque entreprise de robots pourrait former une joint-venture avec une entreprise de puces pour concevoir ses propres puces dédiées ; si cette tendance se confirme, l'effet de verrouillage des conceptions de référence d'英子 sera affaibli.

Pour l'instant, cette fenêtre est encore ouverte ; de l'autre côté, c'est Tesla. Si vous ne pouvez pas la franchir, c'est Wentai ; ce que Yushu a misé 2 milliards de yuans, c'est exactement cela.

La fenêtre ne restera pas ouverte indéfiniment ; à chaque itération de GR00T, cette fenêtre descend un peu plus. De N1 à N1.5, trois mois sont accordés à Unitree, ce qui pourrait représenter deux à trois ans.

Bien sûr, ne soyez pas trop pessimiste. Ce ne sont que des opinions personnelles basées sur des recherches.

Cet article provient du compte officiel WeChat « Wang Zhiyuan » (ID : Z201440), auteur : Wang Zhiyuan