BlockBeats Notícias, 5 de junho: Na noite passada e esta manhã, a renomada instituição de pesquisa e análise SemiAnalysis publicou um relatório indicando que o próximo cluster de servidores de IA da NVIDIA, Rubin NVL72, fará ajustes significativos na configuração de memória, reduzindo a capacidade por gabinete de 55 TB planejados originalmente para 28 TB. Além disso, a maioria dos sistemas Rubin utilizará módulos SOCAMM de 96 GB, em vez dos módulos de 192 GB originalmente planejados. O relatório provocou forte reação no mercado, com a美光 encerrando em queda de 7,7% e a sul-coreana SK Hynix abrindo em queda de 8,32%.
Para isso, a opinião do mercado é geralmente cautelosamente otimista, considerando que o mercado pode ter reagido em excesso.
O KOL americano Herman Jin afirmou que a causa fundamental da redução de memória é a oferta insuficiente, e não a diminuição da demanda. Também pode haver notícias negativas semelhantes sobre a solução de switches da NVIDIA. Ele reforçou novamente que a demanda no lado dos modelos é o indicador-chave para determinar se a onda de IA está terminando.
Outra perspectiva aponta que o próximo foco do mercado deve ser se as medidas de redução de memória são apenas soluções transitórias. Além disso, quando a memória do sistema usada para suportar grandes contextos (KV Cache) no lado CPU for reduzida, o gargalo de desempenho da GPU inevitavelmente se deslocará para o lado SSD e para a interconexão, exigindo que os CSPs adquiram mais SSDs de alto desempenho ou adotem soluções de conexão interna de maior desempenho, beneficiando empresas de NAND, como KIOXIA, SanDisk e empresas de conexão óptica LITE, Marvell (MRVL) e Corning.
