NVIDIAのIsaac GR00Tロボット設計とUST RoboticsのIPOの旅

icon MarsBit
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
NVIDIAは最近、台北で身長1.8メートル、75の自由度を持つ人型ロボット「Isaac GR00T」を公開しました。このロボットのボディはUST RoboticsのH2 Plusを基にしており、脳にはNVIDIAのJetson ThorチップとIsaac GR00Tソフトウェアが使用されています。ETHニュースは、スタンフォード大学とETHチューリッヒが早期採用者であると指摘しています。上海証券取引所のIPO審査を通過したUST Roboticsは、42億元の資金調達を計画しており、その資金は自社のエンボディードAIモデルの構築に充てられます。ETH更新:同社は現在、ロボットボディにNVIDIAのデザインを使用しています。

黄仁勋在台北流行音乐中心的演讲,到了最后压轴环节。结果上台是一台机器人。

いつからか、人々はロボットを「植物人」と呼ぶようになった。おそらく、それほど柔軟ではないからだろうが、そう言うのも間違っていない。

01

黄仁勋是如何介绍这台机器人的呢?身高1.8米,体重68公斤,全身75个自由度;他在台上开了个玩笑,说这个身高体重「和我差不多」。挺有意思的。

このロボットはIsaac GR00Tと呼ばれ、NVIDIA公式の定義ではリファレンスデザインであり、3つのサプライヤーがそれぞれ一部を担当しています。

体幹は宇樹科技のH2 Plus、手はシンガポールのSharpaが開発した五指の機敏なハンド、脳はNVIDIA自社のJetson Thorチップと、一式のIsaac GR00Tソフトウェアスタックを搭載。

私は一つの細部に気づきました:

英子は、この参照設計のターゲットユーザーは高等教育機関および大学の研究者であると述べ、最初の顧客にはスタンフォード大学とスイス連邦工科大学が含まれると述べた。

関連する開発プラットフォームとモデルコードは、まもなくGitHubおよびHugging Faceに公開されます。フルスタックのソフトウェアは開封即使用可能で、研究チームの準備時間が数日から数時間に短縮されます。

言い換えれば、NVIDIAが作っているのは1台のロボットだけではありません。

これはキーワンス・ソリューションです。ボディ、脳、データ生成ツール、トレーニングフレームワーク、シミュレーション環境がすべてパッケージ化されており、電源を接続するだけで実験を開始できます。

私は彼らのデータ生成能力を確認しました。

英子は、Cosmos 3とIsaac GR00T Blueprintを使用すると、11時間で78万本の合成運動トラジェクトリーを生成できると述べました。78万本とはどのような概念でしょうか?これは6500時間分のヒューマンデモンストレーションデータに相当し、ほぼ1人のエンジニアがロボットに動作を教え続けるのに9か月かかる量です。

そして、本日下午、上海証券取引所の上場審査委員会は結果を発表し、宇樹科技の初回上場が承認され、発行条件を満たしていることが確認されました。

73日で審査受理から上場審査通過まで、調達額は42.02億元、総評価額は420億元。A株市場初のヒューマノイドロボット企業として、この前後を「二重の喜び」と表現したい。

ただし、注目すべき細部があります。

黄仁勲のスピーチでは、Unitreeの名前が「体」の欄に表示され、Sharpaが「手」の欄に、NVIDIA自身が「脳」「計算能力」「モデル」「シミュレーション」「データ生成」のすべての欄を占めている。

一方、午後の上海での審議で、宇樹は420億の評価額を獲得した。招集書には明確に記載されており、調達資金の最大の用途はエムボディード大モデル、すなわち脳である。

エヌビディアは「あなたは私の体だ」と言い、同じ日、ユーシュは「私は自分の脳を造る」と言った。なぜ?

02

私は一つの言葉を考案しました。デザインを参考にしました。この言葉は中立的で、技術ドキュメントや一連のソリューションのような印象です。ご参考ください。

この言葉はテクノロジー業界で何度も登場してきましたが、毎回その後の展開は似たようなものです。

携帯電話業界での最も代表的な例。

2010年前後、クアルコムはスナッグドラゴンチップ、モデム、Androidシステム、ドライバ層、ハードウェアインターフェースをすべてパッケージ化し、一連の完全なスマートフォンリファレンスデザインにした。

業界では「ターンキー」と呼ばれ、日本語では「鍵を渡す」ことを意味します。

これはどういう意味ですか?あなたは携帯電話ブランドメーカーであり、自社でチップ設計能力やシステム調整能力を保有する必要も、ハードウェア開発チームを維持する必要もありません。 Qualcommの这套方案を手に取り、ODM工場に依頼して外装を少し変更し、自社のロゴを貼れば、一台の携帯電話が完成します。

紅米第1世代はこのようにして生まれました。当時、小米は聞泰に委託生産し、高通のソリューションを使用しました。その年、聞泰は6,550万台を出荷しました。

トランザクションはウィンウィンに聞こえます。クアルコムはチップを販売し、ブランド企業は開発コストを削減でき、ODM工場は注文を獲得しました。

その後の出来事を調べました。

華勤技術、中国最大のスマートフォンODM企業は、2024年上期の売上高が700億元を超え、親会社株主に帰属する純利益は20億元である。龍旗科技の売上高は350億元、純利益は5億元未満である。

700億の売上、20億の利益、純利益率は3%未満。

これらの企業の携帯電話受託生産の粗利益率は、長年にわたり5%から11%の間で推移している。業界ではこれを「苦労して得る収益」と呼ぶ。上では半導体メーカーに価格を押さえられ、下ではブランドメーカーに価格競争を迫られ、真ん中では同業他社との激しい競争に巻き込まれる。規模は大きくなるほど、利益は薄くなっていく。

聞泰科技、かつてのODM出荷量No.1は、2025年初頭、ODM事業全体を立訊精密に売却し、携帯電話受託生産から完全に撤退した。売却後は半導体事業に全面的にシフトし、その半導体事業の営業利益率は37.47%で、携帯電話受託生産の7倍以上である。

見よ、体を世界一にまで育て上げたが、最後にはやめることを選んだ。

この物語は今日と何の関係があるのでしょうか?私はクアルコム当時と NVIDIA 今日の行動を比較してみました。

クアルコムはチップ、Android、参照設計を提供し、スマートフォン業界のすべての企業がこれを採用した。その結果、ハードウェアはすべて同じようなものになり、利益はブランド企業や製造業者からチップメーカーとオペレーティングシステム企業へと徐々に移っていった。

NVIDIAは本日、Jetson Thorチップ、Isaac GR00Tモデル、およびリファレンスデザインを発表しました。モデルのコードはすべてオープンソース化され、シミュレーションフレームワークもオープンソースで、データ生成ツールもパッケージ化されています。

私はナビダの現在の提携先リストを確認しましたが、UnitreeはJetson Thorを使用しており、Zhiyuan、Galaxy General、UBTechも使用しています。Figure AIやボストン・ダイナミクス、アマゾン、Metaも使用しています。

宇树は十数社のボディーサプライヤーの一つです。

エヌビディアのロボティクス部門のVPは次のように述べました。「私たちはロボットを製造せず、自動車も作っていません。インフラコンピュータとソフトウェアを通じて、業界全体を支援しています。」

この言葉は、 Qualcomm が15年前にほぼ同じバージョンを述べていた。

ある企業が「我々はエンド製品を作らず、プラットフォームとツールのみを提供する」と言うとき、それは実は「ルールは私が決める」と宣言しているのだ。

GR00Tモデルをオープンソース化するのは、かつてGoogleがAndroidをオープンソース化したのと同じロジックだ。ソフトウェアは無料で提供するが、その代わりにあなたのハードウェアに依存してもらうためだ。私のモデルやシミュレーションプラットフォームを使用するなら、私のチップ上で動作させなければならない。

私の見解は以下の通りです:

参考設計は、権力の分配契約のように、誰が参考設計を発表するかが、その業界における脳の価値と体の価値を定義する。

携帯電話業界はすでに一度答えている。体を扱う企業は700億の売上高で、利益率は3%未満。脳を扱う企業は、1年間の特許ライセンス料だけで数百億ドルを収入としている。今、ロボット業界が同じ契約を手にした。

03

私は宇樹の招股書を確認しました。42億ドルの調達資金のうち、20.22億ドルがスマートロボットモデルの開発に充てられ、全プロジェクトの中で最大の割合である48%を占めています。11.1億ドルが本体開発に、4.45億ドルが新製品開発に、6.24億ドルが製造拠点の建設に投資されます。

最もお金をかける場所は、脳である。宇樹はこの仕組みを必ず理解している。

王興興は、過去10年で最大の誤りはAIの技術進歩を過小評価したことだったと語った。彼の元チームは当初、本体と運動制御に重点を置いていたが、最近2年になってようやくエムボディード大モデルへの投資を強化し始めた。

英仮達の参考設計にボディを供給しながら、20億を自らの脳の開発に投じる。これは協力の外衣をまとった独立戦争である。

詳細を確認したところ、NVIDIAのGR00T N1.5は宇樹G1ロボット上で既に動作確認されています。オープンソースコミュニティの開発者がコードを取得し、G1上で直接デプロイと操作タスクのデモを実施しました。GitHubには完全なデプロイチュートリアルが掲載されています。

つまり、英子の脳は宇樹の体に取り込まれた。しかも、このプロセスは公開されており、誰でもコピーできる。

那宇樹は今何をしているのでしょうか?

2025年9月、宇樹は自社開発の世界モデルUnifoLM-WMA-0をオープンソース化した。2026年1月には、視覚言語行動モデルUnifoLM-VLA-0をリリースした。

5月25日、つまり会議公告が発表された日、宇樹はWVLA2.0エミュレーティブ大モデルをテスト公開し、G1ロボットが人間の動きによる干渉がある複雑な環境下で、リモート操作なしに会議室の物品を整理・分類収納することを独立して実現しました。

二つの脳が同じ体で動いている。一つはNVIDIAのもので、オープンソースであり、世界中が利用できる。もう一つは宇樹自身のもので、まだ始まったばかりで、追いつこうとしている。どう形容すればいいのか?

ここにも注目すべきキャラクターがいます。

2024年9月に設立された「中科第五紀」という企業を確認しました。核心チームは中国科学院と清華大学出身です。今年、3回の資金調達を実施し、Pre-Aラウンドは紅杉中国が主導し、最新のAラウンドは孚騰資本と上海半導体産業投資が投資しました。

その身分は宇树科技の001号エムボディードオペレーションブレインサプライヤーである。

両社は宇樹G1ヒューマノイドロボットプラットフォームを基に、電力業界向けのソフトウェアとハードウェアの統合ソリューションを提供している。中科第五紀はまた、美的と協力しており、そのロボットはすでに美的広東佛山工場の生産ラインで実際の運用に導入されている。

あなたは問題に気づきましたか?

宇樹のボディに搭載されている脳は、二つではなく三つある。ナビダのGR00T、宇樹自社開発のUnifoLM、そして中科第五紀のFAMシリーズモデル。

なぜ体を持つ会社が3つの脳と接続しなければならないのか?それは、自分自身の脳を持っていないからだ。

宇樹の2025年の研究開発費用率は8.53%、1.45億円であり、同行の優必選は25%、5.07億円である。宇樹は業界トップクラスの中で研究開発投資比率が最も低い企業の一つである。

この20億は補習の費用です。問題は、補習に期間があることです。

NVIDIAのGR00Tはオープンソースであり、イテレーションが非常に速い。N1からN1.5までわずか3か月未満で更新された。GR00Tが十分に使いやすければ、より多くの開発者と顧客が自然にそれを選ぶようになる。

アンドロイドが広まった後で、自分で携帯電話用のオペレーティングシステムを開発するのは不可能ではないが、ますます難しくなっている。

宇樹が現在行っていることは、アンドロイドスマホにクアルコムチップを搭載して出荷して利益を上げながら、実験室で自社のチップとオペレーティングシステムをこっそり開発していることに相当する。

私は、二つの脳が同時に存在する状態は長く続かないと思う。結局のところ、二つの可能性しかない。一つは、自社開発の脳が追いつき、英子の脳が不要になること。もう一つは、追いつかず、英偉達の脳が唯一の選択肢となり、宇樹が本当に体だけになってしまうことだ。

04

ここで避けられない質問があります。本当にナビダの脳を使わずに、自分自身ですべてをやり遂げる人はいるのでしょうか?

はい、一家。テスラ。そして現在、この一家のみです。

オプティマス人形ロボットに使用されているチップは、テスラが自社開発したFSDチップであり、自動運転に使用されているものと同じです。

同じ訓練パイプライン、データアノテーション体系、ニューラルネットワークアーキテクチャを車からそのまま持ち込みました。推論ハードウェアも互換性があり、現在はHW4で動作し、次世代はAI5にアップグレードされます。

最新の進捗を確認したところ、マスクは今年第1四半期の決算電話会議でいくつかのタイムラインを確認しました。

Optimus V3は年間を通じて発表され、7月から8月にかけてフリーモント工場で量産を開始します。この生産ラインの前身はModel SおよびModel Xの生産ラインで、5月に生産終了後、Optimus専用ラインに改修中であり、年間生産能力は100万台を目標としています。

100万台。宇樹は2025年通年で人型ロボット5,500台を出荷する。

180倍の差です。

同時に、テスラのAI5推論チップの製造が完了し、自社開発チップのサプライチェーンが整備された。これは、トレーニングから推論、クラウドからロボットエッジまで、一連のプロセスにNVIDIAの製品が一切含まれていないことを意味する。

私は、テスラがこれを実現するには、三枚のカードが必要だと考えます。

最初の図は、FSDのデータ・フライホイールです。数百万台のテスラが毎日路上を走行し、現実世界のビジュアルデータを継続的に送信しています。

これらのデータは自動運転の訓練に使用され、ロボットの認識と意思決定の訓練にも活用されています。Optimusのチームは、車両のデータを再利用できるため、ロボット用のデータをゼロから収集する必要はありません。

第二枚は、自社開発のチップです。

ドージョからHW4、そしてAI5に至るまで、テスラは常に独自の計算アーキテクチャを開発してきた。ドージョにはいくつかの波乱があったが、AI5もようやくチップの流片段階に到達した。しかし、その方向性は一貫しており、テスラは自社の脳となる基盤ハードウェアを他者に委ねたくないのだ。

3枚目、スーパーファクトリー。

テスラが百万台以上の車を製造するために構築した生産体制は、ロボットの製造にも直接応用できる。サプライチェーン管理、品質管理、生産能力の拡大は、お金で簡単に手に入れられるものではない。

今振り返ってみると、宇樹にはこの三枚のカードは一枚もありません。これは宇樹が必ず聞泰になることを意味するのでしょうか?いいえ、そうとは限りません。

宇樹はテスラが持っていないカードを一枚持っている。核心部品の自研自産率は90%を超える。モーター、減速機、コントローラーはすべて自社で製造している。

四足ロボットのモーション制御アルゴリズムをゼロから開発し、人型ロボットH1は立ち上げから6か月で完成品を出荷。フルタイムで参加したのはわずか3人だけだった。これは宇樹のボディに技術的価値が詰まっていることを示している。

携帯電話とロボットの比較をする際に、多くの人が見落としている重要な違いがあります。

スマートフォンの物理的な形状はすでに類似化しています。

一つの画面、一つのチップ、一つのバッテリー、外装が異なるだけだ。ハードウェア面ではほとんど差別化の余地がない。そのため、チップメーカーが参考設計を発表すると、すべてのスマートフォンが同じように見え、ブランド企業はマーケティングと価格で競うしかない。

ロボットによって違いがあり、安定して歩けるか、片足で立って蹴られても倒れないか、五本の指で瓶のふたを開けられるかといった能力は、今日では各企業間で大きな差があります。

これは、少なくとも現在の段階では、ボディーが必ずしも死胡同ではないことを意味する。ボディー自体にはまだプレミアムの余地があり、標準化によって飲み込まれていない。

しかし、業界には新たなトレンドが現れています。私は、エムボディードAIチップに対する需要が、標準製品の調達からカスタム専用SoCへと移行していることに気づきました。

つまり、将来的には各ロボット企業が半導体企業と提携して独自の専用チップを開発する可能性があり、もしこのトレンドが成立すれば、インジェンの参考設計によるロックイン効果は弱まるだろう。

現在、この窓はまだ開いている。超えればテスラであり、超えられなければ聞泰である。宇樹が20億を賭けたのが、このことだ。

ウィンドウは常に開いたままではない。GR00Tが各バージョンを繰り返すたびに、このウィンドウは少しずつ下がっていく。N1からN1.5まで、3か月。宇樹に与えられた時間は、おそらく2〜3年だ。

もちろん、あまり悲観的にならないでください。これはあくまで個人的な調査による見解です。

本文は微信公众号「王智遠」(ID:Z201440)より、著者:王智遠

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。