Дизайн робота Isaac GR00T від NVIDIA та шлях до IPO UST Robotics

icon MarsBit
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
NVIDIA недавно продемонструвала свого робота Isaac GR00T у Тайпейі — людиноподібного робота зростом 1,8 метра з 75 ступенями вільності. Тіло базується на H2 Plus від UST Robotics, а мозок використовує чіп Jetson Thor та програмне забезпечення Isaac GR00T від NVIDIA. ETH news зазначає, що Стенфорд і ETH Цюрих є першими користувачами. UST Robotics, яка пройшла перевірку IPO на Шанхайській фондовій біржі, планує залучити 4,2 мільярда юанів. Збори коштів компанії будуть спрямовані на розробку власних моделей ембодід-ІІ. ETH оновлення: компанія зараз використовує дизайн NVIDIA для тіла свого робота.

На фінальному етапі виступу Хуан Ренсюня в Центрі популярної музики в Тайбэї на сцену вийшов робот.

Не відомо, з якого моменту люди почали називати роботів «растеніями». Можливо, тому що вони недостатньо гнучкі — так сказати, мабуть, теж правильно.

01

Подивіться, як Хуан Ренсюнь представляє цього робота: зріст 1,8 м, вага 68 кг, 75 ступенів свободи в усьому тілі; на сцені він зробив жарт, сказавши, що цей зріст і вага «майже як у мене». Досить цікаво.

Цей робот називається Isaac GR00T, офіційне визначення від NVIDIA — це еталонний дизайн, де три постачальники відповідають за кожну частину.

Тіло від Unitree H2 Plus, рука — п’ятипальцева маніпуляторна рука Sharpa з Сінгапуру, мозок — чіп Jetson Thor від NVIDIA, а також повний програмний стек Isaac GR00T.

Я помітив деталь:

Йідзі сказала, що ця еталонна розробка призначена для вищих навчальних закладів та дослідників університетів; до перших клієнтів входять Стенфорд і Цюрихський федеральний політехнічний інститут.

Відповідні платформи розробки та код моделей будуть розміщені на GitHub і Hugging Face; повний програмний стек готовий до використання, час підготовки дослідницької команди скоротився з кількох днів до кількох годин.

Іншими словами, NVIDIA робить не тільки одного робота.

Це готовий розв’язок; тіло, мозок, інструменти генерації даних, фреймворк для навчання, симуляційне середовище — все це вже підключено, вам потрібно лише підключити живлення й почати експерименти.

Я перевірив їхні можливості генерації даних.

Іко сказала, що за допомогою Cosmos 3 та Isaac GR00T Blueprint за 11 годин можна згенерувати 780 тисяч синтетичних траєкторій руху. Що це означає? Це еквівалентно 6500 годинам даних з людськими демонстраціями; майже як інженер безперервно навчає робота рухам протягом 9 місяців.

Потім сьогодні вдень Комітет з перевірки списання Шанхайської фондовій біржі оголосив результати: YuShu Technology успішно пройшла перевірку та відповідає умовам емісії.

73 дні, від прийняття до схвалення, збір коштів 4,202 мільярда юанів, загальна оцінка 42 мільярда юанів. Перша акція китайського ринку з людиноподібними роботами — закріплена. І те, і інше я б хотів описати як подвійну радість.

Але варто звернути увагу на один нюанс,

У виступі Хуан Ренсюня ім’я Yushu з’являється у колонці «тіло»; Sharpa — у колонці «руки»; NVIDIA сама займає цілий блок: «мозок», «обчислювальна потужність», «моделі», «симуляція», «генерація даних».

А вдень, під час розгляду в Шанхаї, Yushu отримала оцінку в 42 мільярди доларів. У проспекті чітко зазначено, що найбільша частина зборів коштів спрямована на ембодімент-моделі великої масштабності. На мозок.

NVIDIA каже, що ти — мій організм, а в той самий день Unitree каже, що я збираюся створити свій мозок. Що відбувається?

02

Я придумав слово, засноване на дизайні. Це слово досить нейтральне, як технічний документ або набір рішень, ознайомтеся з цим.

Це слово з’являлося в технологічному середовищі багато разів, і кожного разу сюжет розвивався майже однаково.

Найбільш характерний випадок — у сфері мобільних телефонів.

Близько 2010 року Qualcomm розпочала один проект. Вона об’єднала чіпи Snapdragon, базовий модем, систему Android, драйвери та апаратні інтерфейси в єдину повну референсну розробку для смартфонів.

У галузі це називають turnkey, що перекладається як «під ключ».

Що це означає? Ви — виробник смартфонів, вам не потрібно володіти здатністю до проектування чіпів, налаштування системи чи утримувати команду з розробки апаратного забезпечення. Взявши цей розв’язок від Qualcomm, знайдіть завод ODM, змініть корпус, нанесіть свій логотип — і смартфон готовий.

Саме так з’явилася перша модель Redmi. Тоді Xiaomi звернулася до Wingtech як до контрактного виробника, використовуючи рішення Qualcomm; у цьому році Wingtech відправила 65,5 мільйона одиниць.

Звучить як виграш для всіх: Qualcomm продала чіпи, бренди зекономили на розробці, а фабрики ODM отримали замовлення.

Потім я перевірив, що сталося далі.

Huqin Technology, найбільша китайська компанія ODM для смартфонів, отримала виручку понад 70 млрд юанів за перші три квартали 2024 року та чистий прибуток материнської компанії у розмірі 2 млрд юанів. Longqi Technology — виручка 35 млрд юанів, чистий прибуток менше 500 млн юанів.

70 мільярдів доходів, 2 мільярди прибутку, рівень чистого прибутку менше 3%.

Довгострокова маржа прибутку цих компаній зі збирання мобільних пристроїв постійно коливається в межах від 5% до 11%. У галузі це називають важко заробленими грошима: зверху тиснуть постачальники чіпів, знизу брендові компанії порівнюють ціни, а посередині — конкуренція з боку суперників. Чим більше робиш, тим тоншою стає прибутковість.

Веньтай Технолоджі, колишній лідер з обсягів поставок ODM, на початку 2025 року здійснила один важливий крок — продала весь ODM-бізнес компанії Luxshare Precision і повністю вийшла з бізнесу зборки мобільних телефонів. Після продажу компанія повністю зосередилася на напівпровідниковому бізнесі, чия валова маржа становить 37,47%, що більше ніж у сім разів, ніж у бізнесі зборки телефонів.

Бачиш, досягнувши першого місця у світі у фізичній підготовці, він нарешті вирішив припинити це робити.

Як ця історія пов’язана з сьогоднішнім днем? Я порівняв те, що Qualcomm робив тоді, з тим, що NVIDIA робить сьогодні.

Компанія Qualcomm випустила чіп, Android та еталонний дизайн — усі в індустрії смартфонів це використали. Що вийшло? Апаратне забезпечення стало однаковим у всіх пристроях, а прибуток поступово перетікав від брендів та виробників до виробників чіпів та розробників операційних систем.

Сьогодні NVIDIA випустила чіп Jetson Thor, модель Isaac GR00T та референсний дизайн. Код моделі повністю відкритий, симуляційний фреймворк також відкритий, а інструменти генерації даних уже пакетовані.

Я подивився на поточний список партнерів NVIDIA: Unitree використовує Jetson Thor, Zhiji, Galaxy General та UBTECH також використовують його. Навіть Figure AI використовує його, Boston Dynamics використовує його, а також Amazon і Meta.

Yushu є одним із дюжини постачальників тіл.

Віце-президент робототехнічного відділу NVIDIA сказав: «Ми не виробляємо роботів і не виготовляємо автомобілі; ми надаємо інфраструктурні комп’ютери та програмне забезпечення, щоб підтримувати весь індустріальний сектор».

Це твердження, ще 15 років тому сказав квалком.

Коли компанія каже: «Ми не створюємо кінцеві продукти, ми надаємо лише платформу та інструменти», вона фактично оголошує: «Правила встановлюю я».

Модель GR00T відкрита, та сама логіка, що й у випадку з Google, коли вони відкрили Android. Програмне забезпечення надається безкоштовно, щоб ви не могли обійтися без моєї апаратної частини. Використовуючи мою модель та симуляційну платформу, ви повинні запускати її на моєму чипі.

Моя думка така:

Згідно з дизайном, як угоди про розподіл повноважень, хто надає еталонний дизайн, той визначає, скільки коштує мозок у цій галузі, а скільки — тіло.

Індустрія смартфонів вже це проходила: компанії, що виробляють тіло, мають до 70 мільярдів доходів і прибутковість менше 3%; компанії, що виробляють мозок, отримують сотні мільярдів доларів США щороку лише від ліцензування патентів. І зараз, випадково, індустрія робототехніки отримала ту саму угоду.

03

Я ознайомився з проспектом Yuque. З 4,2 млрд доларів США залучених коштів, 2,022 млрд доларів США буде інвестовано у розробку моделей інтелектуальних роботів — це 48%, найбільший обсяг серед усіх проектів; 1,11 млрд доларів США — на розробку тіла, 445 млн доларів США — на нові продукти, 624 млн доларів США — на будівництво виробничих баз.

Найбільше грошей вкладають у мозок. YuShu точно розуміє цю гру.

Ван Синьсин сказав: «Найбільшою помилкою останніх десяти років було недооцінити технологічний прогрес ШІ». Раніше його команда зосереджувалася на онтології та керуванні рухом, але лише протягом останніх двох років вони почали активно розвивати ембоді-великі моделі.

Одночасно постачаючи корпуси для референсних дизайнов NVIDIA та витрачаючи 2 мільярди на створення власного мозку. Це війна за незалежність у вигляді співпраці.

Я перевірив деталі: GR00T N1.5 від NVIDIA вже успішно запущений на роботі Unitree G1; розробники з відкритого комunitи отримали код і безпосередньо виконали розгортання та демонстрацію операцій на G1. Повний посібник з розгортання доступний на GitHub.

Тобто мозок Ейко вже поміщено в тіло Yushu. І це відкрито — будь-хто може скопіювати цей процес.

Що робить Нанаїкі?

У вересні 2025 року Unitree відкрила власну світову модель UnifoLM-WMA-0. У січні 2026 року була випущена візуально-мовна дієва модель UnifoLM-VLA-0.

До 25 травня, дня публікації оголошення про зустріч, Unitree опублікувала тестову версію великого моделі WVLA2.0, за допомогою якої робот G1 самостійно впорався з упорядкуванням та класифікацією предметів у кімнаті для зустрічей у складному середовищі з рухомими людьми, без будь-якого віддаленого керування.

Дві мозкові системи, що працюють на одному тілі: одна — від NVIDIA, відкрита, доступна всьому світу, інша — власна Yushu, ще на початковому етапі, ще гнеться. Як це описати?

Тут ще є один персонаж, якого варто врахувати.

Я знайшов компанію «Zhongke Fifth Epoch», засновану лише у вересні 2024 року; її ключова команда походить з Китайської академії наук і Тсінхуа; цього року вона отримала три раунди фінансування: Pre-A-раунд очолив Sequoia Capital China, а останній A-раунд фінансували Fute Capital та Shanghai Semiconductor Industry Investment.

Його статус — постачальник першого тілесного оперативного мозку для Unitree Technologies.

Обидві сторони на базі платформи людиноподібного робота Unitree G1 розробили інтегроване програмно-апаратне рішення для енергетичної галузі; Fifth Generation of CAS також співпрацює з Midea, і його роботи вже працюють у виробничих лініях заводу Midea у Фошані.

Ви виявили проблему?

На тілі Yushu працює не дві, а три нейромережі: GR00T від NVIDIA, UnifoLM, розроблена Yushu, та серія моделей FAM від Zhongke Fifth Epoch.

Чому компанія, яка займається тілом, повинна підключатися до трьох мозків? Тому що в неї ще немає власного.

Рівень витрат на дослідження та розробки Yushu у 2025 році становить 8,53%, або 145 мільйонів юанів; у їхніх конкурентів, таких як UBTECH, цей показник становить 25%, або 507 мільйонів юанів. Yushu є однією з компаній лідерів галузі з найнижчим відсотком інвестицій у дослідження та розробки.

Ці 2 мільярди — це гроші за компенсацію. Проблема в тому, що у компенсації є віконний період.

GR00T від NVIDIA є відкритим кодом і швидко розвивається. Від N1 до N1.5 минуло менше трьох місяців; якщо GR00T буде достатньо зручним, все більше розробників і клієнтів будуть вибирати його за замовчуванням.

Як і коли Android розгорнувся, потім створити власну операційну систему для смартфонів — не неможливо, але все складніше.

Те, що робить Yushu зараз, еквівалентно встановленню чіпів Qualcomm на телефони з Android, виведенню їх на ринок і отриманню прибутку, одночасно таємно розробляючи власні чіпи та операційну систему в лабораторії.

Я вірю, що стан із двома мозками одночасно не триватиме довго — результат буде лише двома варіантами: або власний мозок наздожене, і мозок Інцзи стане зайвим; або не наздожене, і мозок NVIDIA стане єдиним вибором, тоді Yuque залишиться лише з тілом.

04

На цьому моменті виникає незручне питання: чи є хтось, хто справді не використовує мозок NVIDIA і робить усе сам?

Так, одна. Tesla. І наразі тільки ця одна.

Чіпи, використовувані в роботі-андроїді Optimus, є саморозробленими чіпами FSD від Tesla — тими самими, що встановлюються у автомобілях для автопілотування.

Ту саму конвеєрну лінію навчання, систему анотації даних та архітектуру нейронної мережі перенесено безпосередньо з автомобіля. Навіть обладнання для висновків є універсальним — зараз працює на HW4, а наступне покоління буде піднято на AI5.

Я перевірив останні новини: на телефонній конференції з результатами за перший квартал цього року Маск підтвердив кілька термінів.

Optimus V3 заплановано до випуску наприкінці року, а виробництво на заводі у Фрімонті розпочнеться у липні-серпні. Ця виробнича лінія була раніше використовувана для Model S і Model X, після припинення виробництва у травні її перетворюють на спеціалізовану лінію для Optimus з ціллю досягти річної потужності 1 мільйон одиниць.

1 мільйон одиниць. Ушусь випустить 5500 людоподібних роботів у 2025 році.

У 180 разів.

Також чіп AI5 для висновків Tesla вже пройшов процес виробництва, і сформувалася власна система постачання чіпів; це означає, що на всьому ланцюжку — від навчання до висновків, від хмари до роботів на краю — немає жодного продукту NVIDIA.

Я вважаю, що Tesla досягла цього завдяки трьом картам.

Перше: інформаційний цикл FSD. Мільйони Tesla щодня їздять по дорогах, постійно надсилаючи реальні візуальні дані.

Ці дані використовуються для навчання автономного вождення, а також для розвитку сприйняття та прийняття рішень роботами; команді Optimus не потрібно збирати дані для роботів з нуля, оскільки дані з автомобілів можна повторно використовувати.

Другий — власний чіп.

Від Dojo до HW4 до AI5 Tesla постійно розробляла власну обчислювальну архітектуру. Хоча Dojo зіткнувся з багатьма труднощами, а AI5 тільки-но отримав кристал, напрямок залишився незмінним — вона не хоче передавати базове обладнання свого «мозку» іншим.

Третя, суперфабрика.

Виробнича система, яку Tesla використовувала для виробництва мільйонів автомобілів, може бути безпосередньо застосована для виробництва роботів; управління ланцюгом поставок, контроль якості, масштабування виробництва — це не те, що можна швидко купити за гроші.

Зараз, дивлячись назад на Ю Шу, жодної з цих трьох карт не виявлено. Чи означає це, що Ю Шу обов’язково перетвориться на Веньтай? Не обов’язково.

Оскільки Yushu має карту, якої немає у Tesla, частка власної розробки та виробництва ключових компонентів перевищує 90%. Мотори, редуктори та контролери — все виготовлено власноруч.

Алгоритм керування рухом чотириногого робота був розроблений з нуля, а людиноподібний робот H1 був розроблений за шість місяців після запуску проекту — лише три повноцінні співробітники брали участь у цьому. Це свідчить про те, що технології Unitree мають високий рівень складності.

Є одна ключова відмінність, яку багато хто ігнорує, порівнюючи смартфони з роботами.

Фізична форма смартфонів вже стала однаковою.

Екран, чіп, батарея — всі вони однакові, лише корпус різний. На рівні апаратного забезпечення майже немає простору для диференціації. Тому, як тільки виробник чіпів випускає еталонний дизайн, всі смартфони стають однаковими, і брендам залишається лише боротися за маркетинг і ціну.

Різниця між роботами велика: чи зможе він стійко йти, стояти на одній нозі, не падаючи, навіть якщо його штовхнуть, чи відкривати кришку пляшки п’ятьма пальцями — ці здібності сьогодні дуже відрізняються між різними компаніями.

Це означає, що принаймні на поточному етапі тіло не обов’язково є мертвою точкою; саме тіло ще має простір для премії і ще не було з’їдене стандартизацією.

Проте в галузі з’являються нові тенденції. Я зауважив, що попит на чіпи для ембодімент-інтелекту перехід від покупки стандартних продуктів до замовлення спеціалізованих SoC.

Це означає, що в майбутньому кожна компанія-робототехнік може створити спільне підприємство з компанією-виробником чіпів для розробки власних спеціалізованих чіпів; якщо ця тенденція виявиться справедливою, ефект блокування на основі проектів Yingzi буде послаблений.

Зараз це вікно ще відкрите: якщо перестрибнути через нього — це Тесла. Якщо не вдасться — це Вэньтай. Ю Шу вкладає 2 мільярди юанів саме в це.

Вікно не залишиться відкритим довго; з кожною ітерацією GR00T це вікно опускається трохи нижче. Від N1 до N1.5 — три місяці, час, який залишився для Unitree, може становити два-три роки.

Звичайно, не варто бути надто песимістичним. Це лише особисті думки та дослідження.

Цей текст походить з微信-каналу «Ван Чжіюань» (ID: Z201440), автор: Ван Чжіюань

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.