Diseño de robot Isaac GR00T de NVIDIA y el viaje de IPO de UST Robotics

icon MarsBit
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
NVIDIA recientemente presentó su robot Isaac GR00T en Taipei, un humanoide de 1.8 metros de altura con 75 grados de libertad. El cuerpo se basa en el H2 Plus de UST Robotics, mientras que el cerebro utiliza el chip Jetson Thor de NVIDIA y el software Isaac GR00T. ETH news destaca que Stanford y ETH Zurich son adoptadores tempranos. UST Robotics, que aprobó su revisión de IPO en la Bolsa de Valores de Shanghái, planea recaudar 4.2 mil millones de yuanes. La recaudación de fondos de la empresa se centrará en el desarrollo de sus propios modelos de IA encarnada. Actualización de ETH: La empresa actualmente utiliza el diseño de NVIDIA para el cuerpo de su robot.

Al final del discurso de Huang Renxun en el Taipei Pop Music Center, el momento culminante fue una robot que subió al escenario.

No sé desde cuándo la gente empezó a llamar a los robots «plantas». Tal vez porque aún no son lo suficientemente flexibles; decirlo así parece correcto.

01

Mira cómo Huang Renxun presenta este robot: 1.8 metros de altura, 68 kilogramos de peso, 75 grados de libertad en todo el cuerpo; en el escenario hizo una broma diciendo que esa altura y peso «son similares a los míos». Es bastante interesante.

Este robot se llama Isaac GR00T, y la definición oficial de NVIDIA es un diseño de referencia, con tres proveedores cada uno encargado de una parte.

El cuerpo proviene del H2 Plus de Unitree, las manos son la manipuladora de cinco dedos de Sharpa en Singapur, el cerebro es el chip Jetson Thor de NVIDIA, junto con toda la pila de software Isaac GR00T.

He notado un detalle:

Yingzi dijo que los usuarios objetivo de este diseño de referencia son instituciones de educación superior e investigadores universitarios; los primeros clientes incluyen a Stanford y el Instituto Federal Suizo de Tecnología de Zúrich.

La plataforma de desarrollo y el código del modelo se subirán inmediatamente a GitHub y Hugging Face; la pila de software completa está lista para usar, reduciendo el tiempo de preparación del equipo de investigación de días a horas.

En otras palabras, NVIDIA no solo hace un robot.

Es un proyecto llave en mano; te lo entregamos todo: cuerpo, cerebro, herramientas de generación de datos, marco de entrenamiento y entorno de simulación. Solo necesitas conectarlo a la corriente y comenzar a realizar tus experimentos.

I checked their data generation capabilities.

Yingzi dijo que con Cosmos 3 y el Blueprint de Isaac GR00T, se pueden generar 780,000 trayectorias de movimiento sintético en 11 horas. ¿Qué significa 780,000? Equivale a 6,500 horas de datos de demostración humana; casi como si un ingeniero enseñara continuamente movimientos a un robot durante nueve meses.

Luego, hoy por la tarde, el Comité de Revisión de la Bolsa de Shanghai anunció los resultados: la oferta inicial de Unitree Technology fue aprobada y cumple con los requisitos de emisión.

73 días, desde la aceptación hasta la aprobación, recaudando 4.202 mil millones, con una valoración total de 42 mil millones. La primera empresa de robots humanoides en el mercado A-share ha sido asegurada; tanto antes como después, quiero describirlo como una doble alegría.

Pero hay un detalle que merece la pena señalar,

En la charla de Huang Renxun, el nombre de Unitree aparece en la columna de cuerpo; Sharpa aparece en la columna de manos; NVIDIA ocupa toda la sección de cerebro, capacidad de cómputo, modelos, simulación y generación de datos.

Por la tarde, en la reunión de Shanghai, Unitree obtuvo una valoración de 42.000 millones. El prospecto lo indica claramente: la mayor parte de los fondos recaudados se destinará al modelo de inteligencia corporal. Es el cerebro.

NVIDIA dice que eres mi cuerpo, y el mismo día, Unitree dice que voy a construir mi propio cerebro. ¿Qué está pasando?

02

He inventado una palabra, con referencia al diseño. Esta palabra es bastante neutral, como un documento técnico, un conjunto de soluciones; tómala como referencia.

Esta palabra ha aparecido muchas veces en el mundo de la tecnología, y cada vez que sale, la trama posterior es casi la misma.

La más representativa, en la industria de los teléfonos móviles.

Alrededor de 2010, Qualcomm comenzó a hacer algo. Agrupó el chip Snapdragon, el módem, el sistema Android, la capa de controladores y las interfaces de hardware en un diseño de referencia completo para teléfonos móviles.

En la industria se llama turnkey, que se traduce como llave en mano.

¿Qué significa esto? Eres una marca de teléfonos móviles y no necesitas tener capacidad de diseño de chips, capacidad de ajuste de sistemas ni mantener un equipo de investigación y desarrollo de hardware. Con la solución de Qualcomm, buscas una fábrica ODM, modificas la carcasa, colocas tu logotipo y ya tienes un teléfono móvil.

Así fue como surgió el primer Redmi. En aquel entonces, Xiaomi contrató a Wintek como fabricante bajo contrato, utilizando la solución de Qualcomm; ese año, Wintek envió 65,5 millones de unidades.

Suena como una situación ganadora para todos: Qualcomm vendió chips, las marcas ahorraron en investigación y desarrollo, y las fábricas ODM obtuvieron pedidos.

Luego investigué lo que sucedió después.

Huaqin Technology, la empresa ODM de teléfonos más grande de China, generó ingresos de más de 70 mil millones en los primeros tres trimestres de 2024, con una utilidad neta atribuible a los accionistas de 2 mil millones. Longqi Technology generó ingresos de 35 mil millones y una utilidad neta inferior a 500 millones.

70 mil millones en ingresos, 2 mil millones en ganancias, con una margen de beneficio neto inferior al 3%.

La margen bruta de fabricación de teléfonos móviles de estas empresas ha fluctuado durante mucho tiempo entre el 5% y el 11%. La gente de la industria llama a esto dinero difícil de ganar: presionados por arriba por los proveedores de chips, presionados por abajo por las marcas que comparan precios, y presionados por el medio por la competencia. Cuanto más crecen, más delgada se vuelve la margen.

WenTai Technology, anteriormente el líder mundial en envíos de ODM, realizó en principios de 2025 una acción: vendió toda su operación ODM a Luxshare Precision, retirándose por completo del contrato de fabricación de teléfonos; tras la venta, se enfocó integralmente en semiconductores, cuyo margen bruto de la operación es del 37,47%, más de siete veces superior al de la fabricación de teléfonos.

Mira, hacer del cuerpo el número uno a nivel mundial y finalmente decidir dejarlo.

¿Qué tiene esto que ver con hoy? Miré lo que Qualcomm hizo en su día y lo que NVIDIA hace hoy.

Qualcomm lanzó un chip, Android y un diseño de referencia, y todos en la industria de teléfonos móviles los adoptaron. ¿El resultado? Los dispositivos se volvieron todos iguales, y los beneficios pasaron gradualmente de las marcas y fabricantes a los proveedores de chips y sistemas operativos.

NVIDIA lanzó hoy el chip Jetson Thor, el modelo Isaac GR00T y un diseño de referencia. El código del modelo está completamente abierto, el marco de simulación también está abierto y las herramientas de generación de datos vienen empaquetadas.

Vi la lista actual de socios de NVIDIA: Unitree está usando Jetson Thor, Zhiji, Galaxy General y UBTECH también lo están usando. Incluso Figure AI lo está usando, Boston Dynamics lo está usando, y también Amazon y Meta.

Unitree es uno de los docenas de proveedores de cuerpos.

El VP del departamento de robótica de NVIDIA dijo: "No producimos robots ni fabricamos automóviles; proporcionamos soporte técnico a toda la industria mediante computadoras e software de infraestructura."

This statement, Qualcomm said almost the exact same version fifteen years ago.

Cuando una empresa dice: "No producimos productos finales, solo proporcionamos plataformas y herramientas", en realidad está anunciando una cosa: yo establezco las reglas.

El modelo GR00T es de código abierto, con la misma lógica que cuando Google abrió el código de Android. El software te lo doy gratis para que no puedas vivir sin mi hardware. Si usas mi modelo y mi plataforma de simulación, tendrás que ejecutarlo en mi chip.

Mi opinión es la siguiente:

Referencia al diseño, como un acuerdo de asignación de poderes: quien envíe la referencia al diseño está definiendo cuánto vale el cerebro y cuánto vale el cuerpo en esta industria.

La industria del teléfono móvil ya lo ha hecho: una empresa que fabrica cuerpos, con ingresos de 70 mil millones y un margen de beneficio inferior al 3%; una empresa que hace cerebros, que solo en derechos de licencia de patentes recibe cientos de miles de millones de dólares al año. Ahora, por casualidad, la industria robótica ha obtenido el mismo acuerdo.

03

Revisé la prospecto de Unitree. De los 4.2 mil millones de dólares recaudados, 2.022 mil millones se destinarán al desarrollo de modelos de robots inteligentes, representando el 48 %, la inversión más grande de todos los proyectos; 1.11 mil millones para el desarrollo del cuerpo, 445 millones para nuevos productos y 624 millones para construir bases de fabricación.

El lugar donde se invierte más dinero es la mente. Y Unitree ciertamente conoce este juego.

Wang Xingxing dijo una vez que el mayor error cometido en la última década fue subestimar el progreso tecnológico de la IA; su equipo original se centró siempre en el cuerpo y el control del movimiento, hasta que recién en los últimos dos años comenzó a intensificar su enfoque en modelos grandes corporizados.

Mientras suministra el cuerpo para el diseño de referencia de NVIDIA, gasta 2 mil millones en construir su propio cerebro. Esto es una guerra de independencia disfrazada de cooperación.

Verifiqué los detalles: el GR00T N1.5 de NVIDIA ya se ha ejecutado en el robot Unitree G1; los desarrolladores de la comunidad de código abierto han implementado y demostrado tareas operativas directamente en el G1 con el código. Existe un tutorial de implementación completo en GitHub.

Es decir, el cerebro de Eiko ya ha sido transferido al cuerpo de Unitree. Y este proceso es público; cualquiera puede copiarlo.

¿Qué está haciendo Satoiki?

En septiembre de 2025, Unitree lanzó de código abierto su modelo de mundo desarrollado internamente, UnifoLM-WMA-0. En enero de 2026, lanzó el modelo de visión, lenguaje y acción UnifoLM-VLA-0.

Al 25 de mayo, el día en que se publicó el anuncio de la reunión, Unitree lanzó oficialmente el modelo de inteligencia artificial corporal WVLA 2.0, permitiendo que el robot G1 completara de forma independiente la organización y clasificación de artículos en una sala de reuniones en un entorno complejo con personas moviéndose, sin ninguna operación remota.

Dos cerebros corriendo en el mismo cuerpo: uno de NVIDIA, de código abierto, disponible para todos en el mundo; y otro propio de Unitree, recién comenzado, aún intentando alcanzarlo. ¿Cómo te lo puedo describir?

Aquí hay otro personaje que merece atención.

Descubrí una empresa llamada Zhongke Fifth Epoch, fundada en septiembre de 2024, cuyo equipo principal proviene de la Academia China de Ciencias y la Universidad Tsinghua; este año ha recibido tres rondas de financiación consecutivas, con Sequoia Capital China liderando la ronda Pre-A, y la más reciente ronda A financiada por Futeng Capital y Shanghai Semiconductor Industry Investment.

Su identidad es el proveedor número 001 de cerebros de operación encarnada para Unitree Technologies.

Ambas partes desarrollaron una solución integral de software y hardware en la plataforma de robot humanoide Unitree G1 para la industria eléctrica; Zhongke Wudi Ji también está colaborando con Midea, y sus robots ya están operando en las líneas de producción de la fábrica de Midea en Foshan.

¿Has encontrado el problema?

En el cuerpo de Unitree circulan tres cerebros, no solo dos: el GR00T de NVIDIA, el UnifoLM desarrollado por Unitree y la serie FAM de Fifth Epoch of Zhongke.

¿Por qué una empresa que hace cuerpos debe conectar tres cerebros al mismo tiempo? Porque aún no tiene el suyo propio.

La tasa de gastos en I+D de Unitree en 2025 fue del 8,53 %, equivalente a 145 millones; su competidor UBTECH es del 25 %, con 507 millones. Unitree es una de las empresas con la menor proporción de inversión en I+D dentro del liderazgo del sector.

Estos 2 mil millones son el dinero para ponerse al día. El problema es que hay un período límite para ponerse al día.

GR00T de NVIDIA es de código abierto y tiene una velocidad de iteración rápida. Solo pasaron menos de tres meses entre N1 y N1.5; si GR00T es lo suficientemente útil, cada vez más desarrolladores y clientes lo elegirán por defecto.

Al igual que después de que Android se expandiera, intentar crear tu propio sistema operativo para teléfonos no es imposible, pero se vuelve cada vez más difícil.

Lo que Yushu está haciendo ahora es equivalente a instalar chips Qualcomm en teléfonos Android, venderlos y ganar dinero, mientras simultáneamente trabaja en secreto en laboratorio en sus propios chips y sistema operativo.

Creo que el estado de tener dos cerebros al mismo tiempo no durará mucho; el resultado solo puede ser uno de dos: o bien nuestro cerebro interno alcanza el nivel del de Yingzi y ya no se necesita, o bien no lo alcanza y el de NVIDIA se convierte en la única opción, en cuyo caso Yushu quedaría realmente solo con el cuerpo.

04

Al respecto, hay una pregunta que no se puede evitar: ¿alguien realmente funciona sin el cerebro de NVIDIA y lo hace todo por sí mismo?

Sí, una. Tesla. Y por ahora, solo esta.

El chip utilizado en el robot humanoide Optimus es el chip FSD desarrollado por Tesla, el mismo que se instala en los vehículos para la conducción autónoma.

La misma tubería de entrenamiento, sistema de anotación de datos y arquitectura de red neuronal se trasladaron directamente desde el vehículo. El hardware de inferencia también es compatible; actualmente se ejecuta en HW4, y la próxima generación se actualizará a AI5.

Consulté los últimos avances, y en la llamada de resultados del primer trimestre de este año, Musk confirmó varios puntos temporales.

Optimus V3 se lanzará a mitad de año, y la fábrica de Fremont iniciará la producción en masa en julio y agosto. Esta línea de producción es la sucesora de la línea de Model S y Model X, que se retiró en mayo y actualmente se está modificando para convertirla en una línea dedicada a Optimus, con una capacidad anual objetivo de 1 millón de unidades.

1 millón de unidades. Unitree entregará 5,500 robots humanoides en todo el año 2025.

180 veces más.

Al mismo tiempo, el chip de inferencia AI5 de Tesla ya ha completado la fabricación; se ha establecido el sistema de suministro de chips propios; esto significa que, desde el entrenamiento hasta la inferencia, desde la nube hasta los extremos de los robots, no hay ningún componente de NVIDIA en toda la cadena.

Creo que Tesla logró esto con tres cartas.

Primero, el ciclo de datos de FSD. Millones de Tesla circulan diariamente por las carreteras, enviando continuamente datos visuales del mundo real.

Estos datos se utilizan para entrenar la conducción autónoma, así como la percepción y la toma de decisiones de los robots; el equipo de Optimus no necesita recopilar datos de robots desde cero, ya que los datos de los vehículos pueden reutilizarse.

Segunda, chip desarrollado internamente.

Desde Dojo hasta HW4 y luego AI5, Tesla ha estado desarrollando su propia arquitectura de cómputo. Aunque Dojo enfrentó numerosos obstáculos y AI5 acaba de ser fabricado, la dirección no ha cambiado: no quiere entregar el hardware básico de su cerebro a terceros.

Tercera, fábrica supersónica.

El sistema de fabricación que Tesla usó para producir más de un millón de vehículos se puede utilizar directamente para fabricar robots; la gestión de la cadena de suministro, el control de calidad y el aumento de la capacidad productiva no se pueden comprar rápidamente con dinero.

Mirando hacia atrás en Yushu, ninguna de estas tres cartas está presente. ¿Significa esto que Yushu necesariamente se convierte en Wentai? No necesariamente.

Debido a que Unitree tiene una carta que Tesla no tiene, la tasa de investigación y producción propias de los componentes principales supera el 90%. Los motores, reductores y controladores son todos fabricados por ellos mismos.

El algoritmo de control de movimiento de un robot cuadrúpedo se desarrolló desde cero, y el robot humanoide H1 se lanzó en seis meses desde su inicio, con solo tres personas participando a tiempo completo; esto demuestra que la tecnología corporal de Unitree es altamente sofisticada.

Aquí hay una diferencia clave que muchas personas ignoran al hacer la comparación entre teléfonos móviles y robots.

La forma física de los teléfonos móviles ya ha convergido.

Una pantalla, un chip, una batería, solo diferentes carcasas. Prácticamente no hay espacio para diferenciación en hardware. Por eso, cuando los fabricantes de chips lanzan un diseño de referencia, todos los teléfonos se ven iguales, y las marcas solo pueden competir en marketing y precios.

Los robots no son iguales; algunos pueden caminar con estabilidad, mantenerse en un solo pie incluso siendo empujados, y abrir tapas de botellas con cinco dedos. Hoy en día, la diferencia en estas capacidades entre distintas empresas es muy grande.

Esto significa que, al menos en la etapa actual, hacer body no es necesariamente un camino sin salida; el body aún tiene margen de valorización y aún no ha sido absorbido por la estandarización.

Sin embargo, en la industria están surgiendo nuevas tendencias. He observado que la demanda de chips de inteligencia encarnada está pasando de la adquisición de productos estándar a SoC personalizados y especializados.

Esto significa que, en el futuro, es posible que cada empresa de robots forme joint ventures con empresas de chips para desarrollar sus propios chips dedicados; si esta tendencia se confirma, el efecto de bloqueo del diseño de referencia de英子 se verá debilitado.

Actualmente, esta ventana aún está abierta; si la cruzas, es Tesla. Si no la cruzas, es Wentai. Lo que Yushu está apostando con 2 mil millones es exactamente esto.

La ventana no permanecerá abierta; con cada iteración de GR00T, esta ventana se desplaza un poco más abajo. De N1 a N1.5, tres meses; el tiempo留给宇树可能两三年。

Por supuesto, no seas demasiado pesimista. Son solo opiniones personales basadas en investigaciones.

Este artículo proviene del número de WeChat "Wang Zhiyuan" (ID: Z201440), autor: Wang Zhiyuan

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.