Les actions de mémoire AI chutent après le rapport sur la chaîne d'approvisionnement de NVIDIA Rubin

Un rapport sur la chaîne d'approvisionnement du rack Rubin de NVIDIA a fait chuter en premier lieu le secteur de la mémoire IA.

Le rapport indique que la capacité mémoire par baie pourrait passer d'environ 55 To à environ 28 To. Par la suite, Micron a chuté d'environ 7,7 % en une journée, et SK Hynix a baissé de plus de 8 % dès l'ouverture le jour suivant. Plus subtilement, l'auteur du rapport, Dylan Patel, a ultérieurement précisé que de nombreux partages n'ont retenu que la partie la plus frappante, et que ce n'était pas un rapport de « mauvaises nouvelles catastrophiques ».

Cette annonce a suscité une telle réaction car elle touche le point le plus sensible du cycle des composants matériels pour l'IA. Au cours de la période précédente, le marché n'a pas simplement négocié des cycles de mémoire ordinaires, mais a anticipé la production de masse de la plateforme Rubin, qui devrait continuer à stimuler la demande pour les HBM et la mémoire associée, rétablissant ainsi la rentabilité et le pouvoir de fixation des prix des fournisseurs de mémoire. Depuis le GTC de cette année, les HBM4, la part de marché de SK Hynix et la progression de Micron dans la mémoire pour l'IA ont été les thèmes centraux répétés par le marché.

Mais l'expression « la mémoire a été coupée » est trop grossière.

Les ajustements révélés par SemiAnalysis concernent principalement les modifications de configuration côté CPU des SOCAMM et LPDDR dans les armoires Rubin NVL72. La plupart des systèmes pourraient utiliser des modules de 96 Go au lieu des modules de 192 Go à plus haute capacité, réduisant la capacité mémoire par armoire de 55 To prévus à environ 28 To. Ce changement affecte la valeur mémoire par armoire, mais il ne permet pas encore de conclure à une baisse simultanée de la demande de HBM4 côté GPU.

Ce qu'il faut vraiment clarifier, c'est quel pool de profits est affecté par ce ajustement et quelle attente le marché négocie actuellement.

Pourquoi les actions de mémoire AI ont-elles toutes chuté ?

La baisse du marché est une réaction des positions après que les thèmes en haut niveau aient rencontré des mots-clés négatifs.

Les éléments confirmés à ce jour indiquent une forte réaction du marché, mais l'événement reste au niveau des rapports sur la chaîne d'approvisionnement. SemiAnalysis révèle qu'NVIDIA pourrait réduire la configuration SOCAMM côté CPU afin de garantir le rythme de livraison du Rubin NVL72. Les chiffres mentionnés dans le rapport incluent une réduction de la capacité mémoire par baie de serveurs, passant d'environ 55 To à environ 28 To, et une baisse du coût par baie, passant d'environ 7,6 millions de dollars à environ 6,8 millions de dollars. Ces chiffres doivent être compris selon la méthodologie de SemiAnalysis et ne constituent pas encore la BOM (liste des composants) officielle finale d'NVIDIA.

HBM4

Au cours des derniers trimestres, la hausse des actions de mémoire pour l'IA s'est appuyée sur un récit très favorable : plus il y a de baies d'IA, plus la mémoire avancée est en pénurie, et plus les fournisseurs génèrent de bénéfices.

Plus l'histoire est simple, plus le titre négatif est percutant. Dès que « la capacité mémoire est divisée par deux » apparaît, le marché révise d'abord la valeur mémoire par baie, rarement en distinguant immédiatement quel type de mémoire est concerné.

La réaction de Micron est la plus révélatrice.

Il est à la fois un fournisseur traditionnel de DRAM et un bénéficiaire de la mise à niveau de la mémoire des serveurs IA. La résilience que le marché lui a accordée provient en grande partie d'une réévaluation selon laquelle « la mémoire IA n'est plus simplement un bien cyclique ». Si la capacité mémoire par baie du système de Rubin diminue, les investisseurs s'inquiéteront immédiatement de savoir si les prévisions de revenus par baie pour Micron sur les segments SOCAMM et LPDDR n'ont pas été surévaluées.

SK Hynix a également baissé, ce qui indique que cet impact dépasse un seul fournisseur.

Il est plus fort dans le domaine HBM, et le marché avait précédemment rapporté qu'il avait remporté la majeure partie des commandes HBM liées à Vera Rubin. Mais lorsque les transactions sur la mémoire AI deviennent surpeuplées, les capitaux n'attendent pas que tous les détails soient vérifiés avant d'agir. La baisse simultanée des actions de mémoire reflète une contraction de la propension au risque dans le secteur, et non une atteinte uniforme à la fondamentale de chaque entreprise.

La clarification ultérieure de Dylan Patel pointe également dans ce sens. Il a indiqué que le rapport n'avait pas pour but de créer une narration de "catastrophe", et que beaucoup avaient ignoré le contexte.

En langage de marché, cela signifie que les fonds n'ont pas effectué une analyse complète de la chaîne d'approvisionnement, mais ont plutôt réduit rapidement leurs positions après avoir rencontré des mots-clés négatifs sur un secteur en hausse.

L'IA commence à réallouer le pool de profits

Cette fois, la mémoire système côté CPU a principalement été réduite, et non pas le HBM4 à côté du GPU.

La mémoire dans le coffret Rubin ne peut pas être résumée par un seul mot. La méthode la plus simple consiste à la diviser en deux niveaux :

Le premier niveau est le HBM4 côté GPU, dédié au processeur d'accélération lui-même ;

La couche deux est constituée du SOCAMM et du LPDDR côté CPU, plus semblable à la mémoire d'exploitation du système dans son ensemble.

HBM4

Le premier détermine la vitesse à laquelle les données sont fournies au GPU, le second influence la planification globale, la maintenance et les performances de certaines charges de travail.

Les « 55 To à 28 To » mentionnés par SemiAnalysis concernent principalement la mémoire système côté CPU.

Ce qui pourrait changer, c'est le nombre, la capacité et le montant d'achat des modules SOCAMM dans chaque armoire Rubin NVL72. Si la majorité des systèmes passent des modules de 192 Go à des modules de 96 Go, la valeur unitaire des SOCAMM à haute capacité diminue effectivement, ce qui exerce une pression sur l'élasticité des revenus des fournisseurs concernés.

Mais le HBM4 côté GPU est une autre ligne.

La plateforme Rubin reste axée sur les GPU Rubin et les CPU Vera, et le HBM4 reste le composant mémoire central pour le packaging des GPU et la libération de la puissance de calcul. Les informations actuelles ne montrent pas de réduction simultanée de la capacité du HBM4 ou des livraisons des GPU Rubin. Les prévisions antérieures considéraient toujours le HBM comme l'un des éléments les plus critiques et les plus dotés de pouvoir de tarification dans les serveurs AI, et SK Hynix était perçue par le marché comme l'un des principaux bénéficiaires.

You can think of an AI cabinet as an extremely expensive high-performance server.

HBM est plus proche de la mémoire rapide située à côté du GPU, tandis que SOCAMM est plus proche de la mémoire système remplaçable dans l'ensemble du système. Cette mise à jour concerne principalement ce dernier.

Pour les positions, la distinction est directe : si Micron a une exposition plus importante dans la section SOCAMM, une baisse de la valeur unitaire touchera d'abord ses attentes ; la logique HBM de SK Hynix est relativement indépendante, mais sera également affectée par le sentiment du secteur dans le cadre d'un trading surpeuplé.

Réduire la mémoire système et en déduire directement une rupture de la demande pour HBM4 n'est pas suffisamment étayé.

Une répartition plus raisonnable consiste à reconnaître que le pool de profit côté CPU fait face à une pression à la baisse, tandis que le côté GPU et le HBM dépendent toujours du volume total d'expéditions de Rubin et du rythme des commandes HBM4.

Le marché de la mémoire AI ne peut plus être couvert par une seule ligne « toutes les mémoires sont fortes » pour tous les fournisseurs. Micron, SK Hynix et Samsung Electronics ont des expositions différentes dans les domaines du HBM, du SOCAMM, du DRAM traditionnel et du NAND ; différentes mémoires au sein d’un même rack correspondent à des prix, des marges et des contraintes d’offre et de demande distincts.

Can reducing costs lead to more cabinet shipments?

L'interprétation optimiste provient du coût et du rythme de livraison.

Les estimations de SemiAnalysis indiquent que le coût du rack Rubin NVL72 pourrait passer d'environ 7,6 millions de dollars à environ 6,8 millions de dollars, soit une réduction d'environ 800 000 dollars.

HBM4

Pour des fournisseurs de cloud comme Microsoft, Google, Amazon et Meta, les armoires AI ne consistent pas simplement à acheter du matériel, mais à calculer le coût par heure de calcul, les délais de livraison et la stabilité lors du déploiement à grande échelle.

Si la réduction des composants permet à Rubin de livrer plus rapidement, la baisse de la valeur unitaire par machine pourrait être compensée par un plus grand nombre de baies.

La logique n'est pas compliquée. Si l'approvisionnement en SOCAMM à haute capacité est tendu, le fait que NVIDIA choisisse des configurations plus faciles à livrer peut réduire le coût BOM par armoire et diminuer le risque qu'un composant unique bloque la livraison de l'ensemble de l'appareil.

Pour les acheteurs, si une configuration mémoire système inférieure n’affecte pas significativement les charges de travail essentielles, recevoir le rack plus tôt peut être plus attrayant que d’attendre la version entièrement configurée.

Le problème est que cette étape reste actuellement une hypothèse.

La baisse des coûts ne signifie pas automatiquement une augmentation des commandes. Pour que la réduction de la valeur par unité soit compensée par une augmentation du nombre total d'armoires, NVIDIA doit livrer davantage de Rubin NVL72, et les fournisseurs de cloud doivent passer des commandes supplémentaires ou les anticiper.

Les matériaux actuels ne contiennent pas d'ordres publics, de prévisions trimestrielles ou de données d'expédition réelles pour le prouver.

Pour comprendre cela simplement, si la capacité d'un certain type de SOCAMM dans un seul rack approche la moitié, alors la livraison totale des racks doit augmenter de manière significative pour ramener la demande totale en Bit à son niveau initial prévu.

HBM4

Même si les coûts diminuent d'environ 10 %, il ne faut pas en déduire automatiquement que les clients achèteront suffisamment de baies supplémentaires. Les achats des grands fournisseurs de cloud sont également influencés par l'électricité, la construction de centres de données, l'approvisionnement en GPU, l'emballage avancé et les équipements réseau ; une baisse unique du BOM n'est qu'un seul des facteurs.

La situation de HBM est relativement plus stable, mais pas complètement immunisée.

Si la sortie continue de Rubin reste forte, HBM4 reste l'un des segments les plus directement bénéficiaires ; si les livraisons d'ensembles s'avèrent par la suite entravées par d'autres goulots d'étranglement, HBM sera également affecté par le rythme des sorties de la plateforme.

La différence réside dans le fait que ce rapport n'a pas réduit directement la configuration HBM4 ; le marché attend les livraisons totales de baies, et non seulement les chiffres de capacité SOCAMM.

Les données de déversement sont le véritable ancre de prix

Le principal risque actuel est que le marché réévalue d'abord les pools de profit, mais que les données ultérieures ne viennent pas étayer une interprétation optimiste.

Si NVIDIA ou la chaîne d'approvisionnement confirme finalement une adoption à long terme de la configuration SOCAMM plus faible pour Rubin NVL72, sans augmentation significative des livraisons totales de baies, les fournisseurs de mémoire système côté CPU feront face à une compression plus durable de leurs prévisions de revenus.

Pour Micron, l'essentiel n'est pas seulement l'étiquette générale « bénéficiaire de la mémoire IA », mais la répartition des revenus par produit.

Dans les prochains résultats et appels téléphoniques, il faudra observer si la direction divulgue le rythme de croissance des DRAM, SOCAMM et HBM liés aux serveurs IA, ainsi que si la marge brute a été affectée par des changements de spécifications, de prix ou de pouvoir de négociation des clients.

Si l'entreprise ne fournit que des déclarations optimistes sur la demande totale sans expliquer l'impact des ajustements de configuration de SOCAMM, le marché pourrait continuer à appliquer une décote.

Pour SK Hynix, les points de vérification sont plus axés sur le HBM.

Si sa part de commandes HBM4, son rythme de déstockage et ses prix restent solides, ce réajustement ressemble davantage à une fluctuation de sentiment sectoriel ; si, par la suite, le volume total de déstockage de Rubin ou le rythme de livraison HBM est également révisé à la baisse, le marché étendra alors l'impact de SOCAMM à la ligne principale HBM.

C'est également une évolution typique après le milieu du thème de la mémoire IA.

Au début du marché, les acheteurs pariaient sur la tendance : les armoires AI se multiplient, tandis que la mémoire avancée devient de plus en plus rare.

Le sous-jacent a désormais accumulé une forte hausse, et les capitaux commencent à vérifier si chaque bénéfice a réellement été réalisé. Un seul détail de la chaîne d'approvisionnement peut déclencher une fluctuation quotidienne de 7 à 8 %, ce qui indique que le secteur est devenu surpeuplé et que les informations négatives sont plus facilement amplifiées.

Il est encore trop tôt pour qualifier ce recul comme un « déballage des mauvaises nouvelles » ou un « effondrement de la demande en IA » avant la réalisation effective des ventes et la séparation des résultats financiers.

Une approche plus prudente consiste à reconnaître la pression sur la valeur unitaire côté CPU, tout en séparant la tarification de HBM4 et de SOCAMM.

Ce qui changera le plus la donne à l'avenir reste la confirmation par NVIDIA de la BOM finale du Rubin NVL72, la possibilité d'augmenter le plan d'expédition réel des armoires Rubin, ainsi que l'exposition aux revenus et les évolutions de marge brute de Micron, SK Hynix et Samsung Electronics dans les domaines du HBM et du SOCAMM/LPDDR.