Algunas reflexiones antes de Nvidia esta noche
Autor original: @GavinSBaker
Compilado por: Peggy, BlockBeats
Editorial note: After NVIDIA's earnings report, market attention often focuses on revenue, profits, and guidance ranges. But the author of this article, @GavinSBaker, seeks to refocus the discussion on a longer-term perspective: what determines NVIDIA's value is not quarterly data, but how long AI demand will last and whether compute investments are truly generating sustainable returns.
Partiendo de la experiencia histórica de los ciclos tecnológicos, el artículo analiza si se repetirán «burbujas y sobreinversión», y señala que este ciclo de IA enfrenta cuellos de botella en la oferta de electricidad y obleas, lo que podría hacer que el ritmo de expansión sea más cauteloso. Por otro lado, los precios de alquiler de GPU y la alta utilización de chips de modelos anteriores también brindan una validación real del «ROI de IA».
The following is the original text:
Aquí hay algunas observaciones personales que podrían ser útiles para quienes siguen a NVIDIA. En mi opinión, los únicos dos factores clave que realmente merecen discusión en torno a esta empresa son: la sostenibilidad de la demanda y el retorno de la inversión (ROI) en IA, siendo este último estrechamente relacionado con la vida útil efectiva de las GPU.
Sostenibilidad de la demanda: ¿Se repetirá la historia?
Desde la experiencia histórica de las olas tecnológicas, casi todos los ciclos similares han atravesado burbujas financieras y expansión excesiva de la capacidad productiva. Carlota Perez aborda esto sistemáticamente en "Technological Revolutions and Financial Capital". Ella señala que, en cada revolución tecnológica —ya sea ferrocarriles, radio o internet— los mercados financieros identifican tempranamente su potencial a largo plazo, y el entusiasmo capitalista subsiguiente a menudo genera burbujas (lo cual también puede explicarse con lo que Mauboussin denomina "colapso de la diversidad de opiniones"). La burbuja conduce a una construcción excesiva, la cual provoca una caída temporal de la demanda y, a su vez, un colapso del mercado; la sobrecapacidad de la tecnología básica, finalmente, senta las bases para la "edad de oro". La trayectoria del desarrollo de internet es un ejemplo clásico.
Por lo tanto, para NVIDIA, lo crucial no es el desempeño de este trimestre ni las proyecciones del próximo trimestre, que generalmente ya están plenamente anticipadas por los inversores institucionales. Lo realmente importante es la sostenibilidad de los beneficios por acción (EPS), no la pendiente de crecimiento de este año.
Desde las expectativas implícitas en la valoración actual, el mercado parece estar expresando la opinión de que los ingresos de NVIDIA podrían estar cerca de un pico temporal, con una preocupación subyacente sobre la expansión excesiva del gasto en capital. Es importante destacar que la preocupación del mercado no es un «burbuja de valoración», sino un «burbuja de fundamentales», es decir, el riesgo potencial de sobreinversión impulsado por el capex. Si el mercado puede desarrollar confianza en que NVIDIA mantendrá un crecimiento compuesto anual de ingresos en dígitos altos después del año fiscal 2027, el centro de valoración podría recibir apoyo.
¿Esta vez es realmente diferente?
«Esta vez es diferente» suele ser un juicio peligroso. Pero en este ciclo de IA realmente existen diferencias: a nivel global, hay cuellos de botella sustanciales en dos dimensiones clave: electricidad (watts) y obleas de procesamiento avanzado (wafers), y la alivio de estas restricciones podría requerir varios años.
Esta restricción de oferta en el lado de la producción podría, de hecho, contener la expansión excesiva de la capacidad. Si las condiciones lo permiten, los proveedores de nube de escala ultramasiva teóricamente continuarían aumentando su expansión, pero la realidad es que la electricidad y los obleas limitan su ritmo de expansión. A diferencia de las revoluciones tecnológicas históricas descritas por Pérez, en aquella época no existían cuellos de botella de oferta similares que limitaran la velocidad de implementación.
Sin sobreinversión, es difícil que ocurra un colapso, especialmente dado que la valoración general de las acciones tecnológicas actualmente no se encuentra en niveles extremadamente altos.
En estos dos cuellos de botella, las obleas podrían ser más críticas que la electricidad. La gestión de la capacidad de producción de obleas podría convertirse en una variable clave que alargue el ciclo de la IA. La dirección de TSMC siempre ha sido conocida por su prudencia, priorizando el equilibrio industrial y el valor a largo plazo sobre la expansión agresiva a corto plazo. Sin las restricciones de electricidad y obleas, el crecimiento de NVIDIA en los próximos 24 meses podría haber sido más rápido, pero el riesgo de sobreinversión habría aumentado significativamente.
En cierto sentido, las restricciones de oferta podrían estar llevando al ciclo completo de IA a un «estado estacionario de desaceleración». La alta dependencia de la IA de obleas de procesos avanzados podría convertirse en el factor clave para evitar fluctuaciones bruscas en este ciclo.
Para implementar ciertos escenarios extremos, la capacidad de cómputo podría necesitar aumentar hasta cientos o incluso miles de veces el nivel actual. Y el tiempo requerido para esta expansión proporciona, por sí mismo, un margen para que la sociedad se adapte y los sistemas se ajusten.
La experiencia histórica también proporciona un punto de referencia: después de que James Watt inventara la máquina de vapor rotativa, el sistema ferroviario tardó décadas en reemplazar realmente a los caballos. La velocidad de iteración de la IA podría ser más rápida, pero aún así no es suficiente para reestructurar la sociedad en un período extremadamente corto.
Más importante aún, los humanos requieren solo 20–30 vatios de potencia para lograr la «inteligencia general». En un mundo con limitaciones energéticas, esta ventaja de eficiencia persistirá a largo plazo. Por lo tanto, un ciclo de IA más suave y duradero no necesariamente es malo para la sociedad misma.
Vida útil de la GPU y el ROI real de la IA
El precio de alquiler de las GPU refleja esencialmente el valor económico del token y es el indicador clave del «AI ROI». Teóricamente, a medida que se lanzan continuamente chips de mayor rendimiento, el precio de alquiler de las GPU antiguas debería disminuir progresivamente, incluso si la rentabilidad de la inversión en IA es positiva.
Sin embargo, durante los últimos dos meses, los precios de alquiler del H100, que lleva casi cuatro años en servicio, han aumentado significativamente. Esto significa que, especialmente en escenarios de agentic AI y generación de código, la capacidad de cómputo está generando valor económico real y notable.
Al mismo tiempo, incluso con el lanzamiento de Blackwell, los A100 de hace 6 años aún mantienen una alta utilización, y los precios de alquiler no han mostrado una clara relajación. Esto sugiere fuertemente que la vida útil efectiva de las GPU podría ser de al menos 6 años, e incluso superar el período de depreciación de la mayoría de los clientes.
La consecuencia es estructural: si el valor residual es superior a lo previsto, el costo de financiación de las GPU disminuirá aún más. En comparación, los ASIC personalizados para un solo modelo o un uso específico tienen dificultades para lograr ventajas de ciclo de vida similares. En un entorno de rápida iteración, el costo de capital de los chips especializados es mayor y su financiación es más difícil.
En cierta medida, la versatilidad es el foso defensivo de la GPU. Con la separación de las funciones de prefill y decode, y la progresiva formación de un sistema de chips complementario, la arquitectura de computación está evolucionando de un «enfoque de chip único» a un «sistema de cooperación multi-chip». La infraestructura de IA ya no depende de un solo dispositivo, sino de un sistema de ingeniería altamente acoplado.
Con la desconexión entre prefill y decode, el ecosistema de NVIDIA podría completar su reestructuración antes que el ecosistema de TPU. Sumado a las diferencias en las decisiones de diseño entre distintos fabricantes, las ventajas relativas de los clientes en términos de costos de inferencia están cambiando.
Si algunos fabricantes anteriormente dependían de la ventaja de costos para reducir el precio de los tokens y competir por cuota de mercado, entonces, cuando esta ventaja se debilite, el comportamiento del mercado tenderá a ser más racional. A largo plazo, esto tendrá un impacto positivo en el ROI de la IA, especialmente durante la transición de la demanda de capacidad de cómputo desde el entrenamiento hacia la inferencia.
Este giro, tal vez, merece más atención que cualquier resultado trimestral.
Última愿望 fácil: espero que NVIDIA vuelva a usar superhéroes como nombres en código para sus chips. Sorprendentemente, el "bando verde" nunca ha utilizado el nombre "Banner" (el nombre real del personaje de Marvel Hulk).
Haz clic para conocer los puestos disponibles en BlockBeats
¡Bienvenido a la comunidad oficial de律动 BlockBeats!
Grupo de suscripción de Telegram: https://t.me/theblockbeats
Grupo de Telegram: https://t.me/BlockBeats_App
Cuenta oficial de Twitter: https://twitter.com/BlockBeatsAsia
