BlockBeats : Le 5 juin, la nuit dernière et ce matin, le célèbre organisme d'analyse et d'investissement SemiAnalysis a publié un rapport d'analyse indiquant que la prochaine génération de cluster de serveurs AI d'NVIDIA, Rubin NVL72, apportera des ajustements majeurs à sa configuration mémoire, avec une capacité par baie réduite de 55 To à 28 To. En outre, la plupart des systèmes Rubin utiliseront des modules SOCAMM de 96 Go au lieu des modules de 192 Go initialement prévus. Ce rapport a provoqué une forte réaction sur les marchés : Micron a clôturé en baisse de 7,7 %, et SK Hynix en Corée du Sud a ouvert en chute de 8,32 %.
Pour ce qui en est, les opinions du marché sont généralement prudemment optimistes, estimant que le marché a réagi de manière excessive.
KOL américain Herman Jin indique que la réduction de la mémoire est principalement due à un manque d'offre, et non à une baisse de la demande. Des nouvelles négatives similaires pourraient également affecter la solution d'interconnexion d'NVIDIA. Il souligne à nouveau que la demande côté modèle est l'indicateur clé pour déterminer si la vague d'IA prend fin.
D'autres avis soulignent que le prochain axe d'attention du marché devrait être de déterminer si les mesures de réduction de la mémoire ne sont qu'une solution transitoire. De plus, une fois que la mémoire système utilisée sur le côté CPU pour gérer de grands contextes (KV Cache) est réduite, les goulots d'étranglement de la puissance de calcul GPU se déplaceront inévitablement vers le côté SSD et les interconnexions. Les CSP devront acheter davantage de SSD haute performance ou adopter des solutions de connexion plus performantes au sein des armoires, ce qui profitera aux entreprises NAND telles que KIOXIA, SanDisk, ainsi qu'aux entreprises de connexion optique Lite, Marvell (MRVL) et Corning.
