NVIDIA Rubin SOCAMM Memory Cut provoca pánico en el mercado y caída de MU

Artículo escrito por Chaoxiang Research

El 4 de junio, a la madrugada, la institución de investigación independiente más influyente de la industria de semiconductores, SemiAnalysis, publicó un boletín matutino.

La información clave es solo una frase: La capacidad de DRAM SOCAMM por bastidor en la Vera Rubin de NVIDIA, NVL72, podría reducirse de los aproximadamente 55 TB previstos a unos 28 TB. La mayoría de los sistemas Rubin utilizarán módulos SOCAMM de 96 GB, en lugar de los 192 GB que se esperaban ampliamente en el mercado.

Tras difundirse la noticia, la reacción del mercado fue directa y brusca: la demanda de memoria se redujo a la mitad, lo que perjudicó a Micron. MU cayó más del 10% durante la sesión, desplomándose desde su récord histórico de 1.089 dólares alcanzado el día anterior hasta 971 dólares, borrando más de 100.000 millones de dólares en capitalización de mercado en un solo día.

El pánico es real, pero la pregunta es: ¿la dirección del pánico es correcta?

Primero, aclara las cuentas

Vera Rubin NVL72 es el próximo superordenador de gama alta de NVIDIA. Cada bastidor contiene 72 GPU Rubin y 36 CPU Vera. En el lado de la GPU se utiliza HBM4, con 288 GB por unidad, lo que suma aproximadamente 20,7 TB en todo el bastidor; esta parte no ha cambiado. Lo que ha cambiado es el lado de la CPU.

Cada CPU Vera cuenta con 8 ranuras SOCAMM, cada una de las cuales puede alojar módulos de distintas capacidades. Las especificaciones oficiales anunciadas por NVIDIA en CES 2026 indican que "cada CPU Vera admite hasta 1.5 TB de LPDDR5X", lo que corresponde a una configuración con 8 módulos de 192 GB completamente instalados. Con 36 CPU, se alcanzan 54 TB.

El informe de SemiAnalysis indica que la configuración real de salida probablemente no estará completamente llenada. La mayoría de los sistemas utilizarán módulos de 96 GB, 8 × 96 GB = 768 GB por CPU, y 36 CPUs equivalen a aproximadamente 28 TB.

De 55 TB a 28 TB, la capacidad se redujo casi a la mitad; los titulares sensacionalistas lo expresarían como "la demanda de memoria se redujo a la mitad".

Pero esta cuenta, el mercado se equivocó en una variable clave.

Lógica fallida del pánico

Primero, SOCAMM tiene un diseño de ranura, no está soldado.

Este es el detalle técnico más fácilmente ignorado en toda la historia. A diferencia del LPDDR soldado directamente en la placa base del GB300 Blackwell Ultra, la plataforma Vera Rubin utiliza módulos SOCAMM2 estandarizados por JEDEC, intercambiables, reemplazables en caliente y actualizables posteriormente. Hoy insertas 96 GB, y mañana, si el cliente lo necesita, simplemente retiras y reemplazas por 192 GB o incluso 256 GB, tan fácil como cambiar una barra de memoria.

NVIDIA destacó este diseño en CES 2026: el tiempo de ensamblaje de toda la plataforma de cómputo se redujo de 2 horas a 5 minutos. La modularidad, mantenibilidad y actualizabilidad son una de las mayores evoluciones arquitectónicas de Vera Rubin en comparación con Blackwell.

Reducir la configuración inicial de venta no equivale a la desaparición permanente de la demanda. Es más bien una estrategia de "subirse primero y pagar después".

En segundo lugar, la razón para reducir la capacidad no es que no se necesite, sino que es "insuficiente".

El fundador de SemiAnalysis, Dylan Patel, dijo en Twitter una frase significativa: "Me gusta mucho una cosa: las personas que comparten nuestro informe omiten la mayor parte del contenido del informe. Esto ocurre con frecuencia."

Los comentarios de los lectores en Digg sobre esta noticia también son muy reveladores: el 77.8% de los comentarios considera que la retransmisión es un clickbait con titulares sacados de contexto.

Lo que se omitió es el fondo.

En 2026, la oferta global de LPDDR5X será extremadamente ajustada. Micron indicó claramente en la reunión de Wolfe a finales de mayo que la demanda de memoria supera significativamente la capacidad de suministro, y se espera que esta situación persista más allá de 2026. La capacidad total de HBM de Micron para el año fiscal 2026 ya está agotada, y el precio promedio del DRAM aumentó más del 110% interanual, con una margen bruto que alcanzó el 74%. Samsung y SK Hynix también operan a plena capacidad y venden todo su producto.

En este contexto, el problema que enfrenta NVIDIA no es que los clientes no quieran más memoria, sino que "no puedo obtener suficientes chips LPDDR5X para llenar cada ranura".

Reducir la configuración predeterminada de SOCAMM por rack es, en esencia, una gestión de la cadena de suministro desde el punto de vista de la ingeniería: en lugar de retrasar la entrega de todo el rack por falta de memoria, se envía primero con una configuración más baja para que la potencia de cálculo se active lo antes posible.

Esta no es una señal de contracción de la demanda; todo lo contrario, es una señal de que la demanda supera a la oferta.

Tercero, menos memoria no equivale a menos racks.

El mercado hizo una multiplicación sencilla: la memoria por rack se reduce a la mitad → la demanda total se reduce a la mitad. Pero este problema tiene otra variable: las salidas.

Si cada rack de SOCAMM se reduce de 55 TB a 28 TB, NVIDIA puede instalar más racks bajo las mismas restricciones de suministro de LPDDR5X. Anteriormente, un lote de memoria solo alcanzaba para 100 racks; ahora alcanza para casi 200.

El consumo total de LPDDR5X no ha disminuido, simplemente se ha distribuido entre más racks. Para NVIDIA, esta es una opción práctica para llevar más rápido Rubin al mercado; para los fabricantes de memoria, el volumen total de pedidos no necesariamente disminuye.

Además, la demanda de memoria en el lado CPU para escenarios de inferencia es muy flexible. No todas las cargas de trabajo requieren 1.5 TB de LPDDR5X. El entrenamiento de modelos grandes consume mucha memoria, pero muchas tareas de inferencia, especialmente las de IA agente y inferencia con contexto largo, pueden gestionar dinámicamente la caché KV entre HBM y LPDDR mediante NVLink-C2C. Para muchos clientes, 768 GB de memoria en el lado CPU ya son suficientes.

¿Por qué Micron aún cayó un 10%?

Porque SemiAnalysis es solo la segunda paja que rompe la espalda del camello.

La primera paja fue Broadcom. Antes de la apertura del mercado estadounidense el 4 de junio, Broadcom publicó sus resultados del Q2. Los números en sí no eran malos: ingresos de 22,190 millones de dólares, un aumento del 48% interanual, y un EPS no-GAAP de 2,44 dólares, por encima de las expectativas. Pero el CEO, Hock Tan, no aumentó la proyección anual de ingresos por chips de IA a 100 mil millones de dólares, y el mercado lo consideró "insuficiente". La acción de Broadcom cayó un 15%, arrastrando consigo a todo el sector de semiconductores en una caída generalizada.

Micron no tuvo ningún evento negativo a nivel corporativo ese día. Medios como TipRanks, Motley Fool y 24/7 Wall St. indicaron claramente que se trató de una caída por contagio. Como activo central en la cadena de memoria para IA, Micron está altamente vinculado al sentimiento sobre el gasto de capital en IA; las proyecciones de Broadcom llevaron al mercado a reevaluar las expectativas de crecimiento para toda la cadena de suministro de chips de IA.

El informe de SemiAnalysis se difundió el mismo día, brindando a los operadores que ya buscaban razones para vender una narrativa perfecta: no solo se había debilitado el ánimo general de la IA, sino que también los números específicos de la demanda de memoria estaban disminuyendo.

Una acción con una capitalización de mercado de un billón de dólares ha aumentado un 900% en el último año y ayer estableció un nuevo récord histórico. En este nivel, cualquier titular negativo es un catalizador para tomar ganancias. El pánico no necesita ser correcto, solo necesita una excusa.

Interpretación de la corriente

Three judgments.

En primer lugar, el informe de SemiAnalysis en sí es preciso, pero la interpretación del mercado es errónea. La configuración predeterminada de SOCAMM para Rubin NVL72 probablemente efectivamente estará por debajo del máximo teórico, lo cual está determinado por la realidad de la cadena de suministro y la elasticidad de la demanda del cliente. Sin embargo, entre "la reducción de la configuración predeterminada" y "la contracción de la demanda de memoria" existe una arquitectura modular con módulos actualizables y una realidad industrial en la que la demanda supera con creces la oferta.

En segundo lugar, el riesgo principal de Micron actualmente no es SOCAMM, sino HBM4. SemiAnalysis informó en febrero de este año que, en los pedidos de HBM4 para la plataforma Rubin de NVIDIA, la cuota de Micron es cero, con SK Hynix llevándose el 70% y Samsung el 30%. Aunque Micron anunció en marzo la producción en masa y el envío de HBM4, se espera que su cuota de mercado sea solo del 18%. Por el contrario, la posición de Micron en el ámbito de SOCAMM es muy sólida: es el primer fabricante en lanzar un SOCAMM2 de 256 GB y ha sido el socio central de NVIDIA en soluciones SOCAMM durante los últimos cinco años. La reducción en la configuración de SOCAMM tiene un impacto real mucho menor en Micron que la marginalización en la cuota de HBM4.

Tercero, la naturaleza de esta caída es la toma de ganancias en una acción con un capitalización de mercado de billones de dólares tras alcanzar un nuevo récord histórico, amplificada por dos catalizadores independientes. Broadcom generó un impacto emocional, y SemiAnalysis aportó munición narrativa. La combinación de ambos provocó una corrección del 10% en una acción que había aumentado nueve veces en los últimos 12 meses. Desde una perspectiva de trading, esto no se llama "pánico", se llama "normal".

Dylan Patel tiene razón en ese tuit: la mayoría de las personas que compartieron su informe realmente omitieron la parte más importante del informe.

Lo más peligroso en la inversión en semiconductores no es equivocarse en la dirección, sino acertar en el título pero calcular mal la fórmula.