Mensaje de BlockBeats, 5 de junio: anoche y esta mañana, la reconocida institución de investigación e inversión SemiAnalysis publicó un informe que indica que la próxima generación de clústeres de servidores de IA de NVIDIA, Rubin NVL72, realizará importantes ajustes en la configuración de memoria, reduciendo la capacidad por gabinete de los 55 TB planeados originalmente a solo 28 TB. Además, la mayoría de los sistemas Rubin utilizarán módulos SOCAMM de 96 GB en lugar de los 192 GB originalmente planeados. Este informe provocó una fuerte reacción en el mercado: Micron cerró con una caída del 7,7 %, y SK Hynix de Corea del Sur cayó un 8,32 % al abrir.
Para esto, la opinión del mercado es generalmente cautelosamente optimista, considerando que el mercado ha reaccionado en exceso.
El KOL de EE. UU. Herman Jin indicó que la causa fundamental de la reducción de memoria es la insuficiencia de oferta, no una disminución de la demanda. También podrían existir noticias negativas similares sobre la solución de conmutadores de NVIDIA. Vuelve a enfatizar que la demanda en el lado del modelo es el indicador clave para determinar si la ola de IA ha terminado.
Otra perspectiva señala que el próximo foco del mercado debe ser determinar si las medidas de reducción de memoria son solo soluciones transitorias. Además, una vez que la memoria del sistema utilizada en el lado CPU para cargar grandes contextos (KV Cache) se reduzca, el cuello de botella de potencia de GPU se desplazará inevitablemente hacia el lado SSD y el lado de interconexión; los CSP necesitarán adquirir más SSD de alto rendimiento o implementar soluciones de conexión interna de mayor rendimiento, lo que beneficiará a empresas de NAND, como KIOXIA, SanDisk y empresas de conexión óptica como LITE, Marvell (MRVL) y Corning.
