NVIDIA Rubin SOCAMM Memory Cut déclenche la panique sur le marché et une chute de MU

Article rédigé par Chaoxiang Research

Le 4 juin à l'aube, l'institut de recherche indépendant le plus influent du secteur des semi-conducteurs, SemiAnalysis, a publié un bulletin matinal.

L'容量 de mémoire DRAM SOCAMM par rack pour les systèmes NVIDIA Vera Rubin NVL72 pourrait passer de environ 55 To à environ 28 To ; la plupart des systèmes Rubin utiliseront des modules SOCAMM de 96 Go, et non les 192 Go largement attendus sur le marché.

Après la diffusion de l'information, la réaction du marché a été directe et brutale : la demande en mémoire a été divisée par deux, ce qui pèse sur Micron. MU a chuté de plus de 10 % en séance, passant brutalement de son record historique de 1 089 dollars établi la veille à 971 dollars, effaçant plus de 100 milliards de dollars de capitalisation boursière en une seule journée.

La panique est réelle, mais la question est : la direction de la panique est-elle correcte ?

D'abord, clarifions les comptes.

Vera Rubin NVL72 est le prochain supercalculateur d'entreprise d'NVIDIA. Chaque baie contient 72 GPU Rubin et 36 CPU Vera. Du côté GPU, on utilise toujours du HBM4, à 288 Go par puce, soit environ 20,7 To au total pour l'ensemble de la baie — cette partie n'a pas changé. Ce qui change, c'est du côté CPU.

Chaque CPU Vera dispose de 8 emplacements SOCAMM, chacun pouvant accueillir des modules de différentes capacités. Les spécifications officielles annoncées par NVIDIA lors du CES 2026 indiquent « jusqu'à 1,5 To de LPDDR5X par CPU Vera », ce qui correspond à une configuration avec 8 modules de 192 Go pleinement installés. Pour 36 CPU, cela représente 54 To.

Le rapport de SemiAnalysis indique que le configuration réelle de sortie n'est probablement pas entièrement remplie. La plupart des systèmes utiliseront des modules de 96 Go, soit 8 × 96 Go = 768 Go par CPU, ce qui représente environ 28 To pour 36 CPU.

De 55 To à 28 To, la capacité a été réduite de près de la moitié ; les titres accrocheurs affirment que « les besoins en mémoire ont été divisés par deux ».

Mais le marché a mal calculé une variable clé.

Logical flaw in panic

First, SOCAMM is designed with a slot-based layout, not soldered in place.

C'est le détail technique le plus facilement négligé de toute l'histoire. Contrairement au LPDDR soudé directement sur la carte mère du GB300 Blackwell Ultra, la plateforme Vera Rubin utilise des modules SOCAMM2 normalisés selon JEDEC, interchangeables, remplaçables à chaud et évolutifs. Aujourd'hui, vous installez 96 Go ; demain, si le client en a besoin, vous les retirez et les remplacez par 192 Go ou même 256 Go, aussi facilement qu'on change une barrette de mémoire.

NVIDIA a souligné ce design lors du CES 2026 : le temps d'assemblage de l'ensemble de calcul a été réduit de 2 heures à 5 minutes. La modularité, la maintenabilité et la mise à niveau constituent l'une des évolutions architecturales majeures de Vera Rubin par rapport à Blackwell.

Réduire la configuration initiale de sortie ne signifie pas que la demande disparaît définitivement. C'est plutôt une stratégie du type « montez d'abord, payez ensuite ».

Deuxièmement, la raison de la réduction de la capacité n'est pas qu'elle n'est pas nécessaire, mais qu'elle est « insuffisante ».

Dylan Patel, fondateur de SemiAnalysis, a déclaré sur Twitter : « J’aime beaucoup une chose : les personnes qui partagent notre rapport omettent la majeure partie de son contenu. Cela arrive souvent. »

Les commentaires des lecteurs sur Digg sont également révélateurs : 77,8 % des commentaires estiment que la propagation secondaire est un clickbait trompeur.

Ce qui a été omis, c'est le contexte.

L'offre mondiale de LPDDR5X sera extrêmement tendue en 2026. Micron a clairement indiqué lors de la conférence Wolfe fin mai que la demande en mémoire dépasse largement la capacité de production, une situation qui devrait se prolonger au-delà de 2026. La capacité annuelle de HBM de Micron pour l'exercice fiscal 2026 est déjà entièrement vendue, le prix moyen du DRAM a augmenté de plus de 110 % en glissement annuel, et la marge brute a atteint 74 %. Samsung et SK Hynix sont également à pleine capacité et vendent tout leur produit.

Dans ce contexte, le problème qu'affronte NVIDIA n'est pas que les clients ne veulent pas plus de mémoire, mais plutôt « je ne peux pas obtenir suffisamment de puces LPDDR5X pour remplir chaque emplacement ».

Réduire la configuration par défaut de SOCAMM par rack est, en substance, une gestion de la chaîne d'approvisionnement d'ordre technique : plutôt que de retarder la livraison de l'ensemble du rack en raison d'une pénurie de mémoire, il vaut mieux expédier une configuration plus faible pour permettre un déploiement plus rapide de la puissance de calcul.

Ce n'est pas un signe de contraction de la demande ; au contraire, c'est un signe que la demande dépasse l'offre.

Troisièmement, moins de mémoire ≠ moins de racks.

Le marché a effectué une simple multiplication : réduction de la mémoire par rack de moitié → demande totale divisée par deux. Mais cette équation comporte une autre variable : les livraisons.

Si la capacité de chaque rack SOCAMM passe de 55 To à 28 To, NVIDIA peut installer davantage de racks sous les mêmes contraintes d'approvisionnement en LPDDR5X. Auparavant, un lot de mémoire suffisait à installer 100 racks ; maintenant, il en suffit pour près de 200.

La consommation totale de LPDDR5X n'a pas diminué, elle a simplement été répartie sur un plus grand nombre de baies. Pour NVIDIA, il s'agit d'un choix pragmatique pour accélérer la mise sur le marché de Rubin ; pour les fabricants de mémoire, le volume total des commandes ne diminue pas nécessairement.

De plus, les besoins en mémoire côté CPU pour les scénarios d'inférence varient considérablement. Toutes les charges de travail n'exigent pas 1,5 To de LPDDR5X. L'entraînement de grands modèles consomme effectivement beaucoup de mémoire, mais de nombreuses tâches d'inférence, en particulier les IA agentic et les inférences à long contexte, peuvent gérer dynamiquement le cache KV entre HBM et LPDDR via NVLink-C2C. Pour de nombreux clients, 768 Go de mémoire côté CPU suffisent.

Pourquoi Micron a-t-il encore chuté de 10 % ?

Parce que SemiAnalysis n'est que la deuxième paille qui brise le dos du chameau.

La goutte d'eau a été Broadcom. Avant l'ouverture des marchés américains le 4 juin, Broadcom a publié ses résultats du Q2. Les chiffres en eux-mêmes étaient solides : un chiffre d'affaires de 22,19 milliards de dollars, en hausse de 48 % en glissement annuel, et un EPS Non-GAAP de 2,44 dollars, supérieur aux attentes. Toutefois, le PDG Hock Tan n'a pas relevé son objectif annuel de revenus issus des puces AI à 100 milliards de dollars, ce que le marché a jugé « insuffisant ». Le cours de Broadcom a chuté de 15 %, entraînant dans sa chute l'ensemble du secteur des semi-conducteurs.

Micron n'a pas publié de mauvaises nouvelles au niveau de l'entreprise ce jour-là. De nombreux médias, tels que TipRanks, Motley Fool et 24/7 Wall St., ont clairement indiqué qu'il s'agissait d'une baisse liée par effet d'entraînement. En tant qu'actif central de la chaîne de mémoire AI, Micron est fortement corrélé aux attentes en matière de dépenses de capital dans l'IA ; les prévisions de Broadcom ont conduit le marché à réévaluer la croissance attendue de toute la chaîne de valeur des puces AI.

Le rapport de SemiAnalysis s'est répandu le même jour, offrant aux traders déjà à la recherche d'excuses pour vendre un récit parfait : ce n'était pas seulement l'humeur globale sur l'IA qui s'assombrissait, mais aussi les chiffres spécifiques de la demande en mémoire qui diminuaient.

Une action d'une capitalisation boursière de mille milliards de dollars, qui a augmenté de 900 % au cours de la dernière année et vient de atteindre un nouveau record la veille. À ce niveau, tout titre négatif est un catalyseur pour prendre des bénéfices. La panique n'a pas besoin d'être justifiée, elle a seulement besoin d'une excuse.

Analyse des tendances

Three judgments.

Premièrement, le rapport de SemiAnalysis est en lui-même exact, mais l'interprétation du marché à son sujet est erronée. La configuration par défaut de Rubin NVL72 pour SOCAMM est probablement effectivement inférieure à la valeur maximale théorique, ce qui est déterminé par la réalité de la chaîne d'approvisionnement et l'élasticité de la demande des clients. Toutefois, il existe une différence fondamentale entre une « configuration par défaut réduite » et une « baisse de la demande en mémoire », car cette dernière est séparée de la première par une architecture modulaire avec des modules évolutifs interchangeables, ainsi que par une réalité industrielle où la demande dépasse largement l'offre.

Deuxièmement, le risque principal pour Micron n'est pas SOCAMM, mais HBM4. SemiAnalysis a rapporté en février de cette année que, dans les commandes d'HBM4 pour la plateforme Rubin de NVIDIA, la part de Micron était nulle, avec SK Hynix détenteur de 70 % et Samsung de 30 %. Bien que Micron ait annoncé en mars la production en série et la livraison d'HBM4, sa part de marché est estimée à seulement 18 %. À l'inverse, la position de Micron dans le domaine SOCAMM est très solide : c'est le premier fabricant à avoir lancé un SOCAMM2 de 256 Go, et le partenaire principal du programme SOCAMM de NVIDIA depuis cinq ans. La réduction des configurations SOCAMM a un impact réel bien moindre sur Micron que son érosion sur le marché HBM4.

Troisièmement, cette baisse résulte d'une prise de bénéfices sur une action d'une capitalisation boursière de mille milliards de dollars après avoir atteint un nouveau record historique, amplifiée par deux catalyseurs indépendants. Broadcom a apporté un choc émotionnel, tandis que SemiAnalysis a fourni des arguments narratifs. Leur combinaison a provoqué un recul de 10 % pour une action qui avait augmenté de 9 fois au cours des 12 derniers mois. Du point de vue du trading, ce n'est pas ce qu'on appelle une « panique » ; c'est ce qu'on appelle « normal ».

Dylan Patel a raison sur ce tweet : la plupart des personnes qui ont partagé son rapport ont effectivement omis la partie la plus importante du rapport.

La chose la plus dangereuse dans l'investissement dans les semi-conducteurs n'est pas de se tromper sur la direction, mais de bien comprendre le titre tout en se trompant sur la formule.