Analyste : La demande en IA pourrait faire grimper les actions de mémoire jusqu'à 10 fois plus haut alors que SK Hynix dépasse Samsung

iconCoinpaper
Partager
AI summary iconRésumé

Un chercheur écrivant sous le pseudonyme Zeitgeist a déclaré que la demande en mémoire pour l'intelligence artificielle dépasse de plusieurs ordres de grandeur ce que le monde est actuellement capable de produire. Selon lui, les actions des fabricants de mémoire pourraient augmenter dix fois leur niveau actuel si elles étaient évaluées non pas selon les sommets historiques, mais selon le besoin réel en calcul.

Zeitgeist a donné un exemple frappant : un investissement de 50 000 $ dans les actions de Micron en septembre de l'année dernière vaudrait aujourd'hui environ 489 000 $. Selon lui, certains investisseurs craignent d'avoir déjà manqué le mouvement, tandis que d'autres redoutent de devenir « la liquidité que les grands acteurs utilisent pour sortir de leurs positions ». L'analyste suggère d'envisager cette opportunité différemment, à travers l'arithmétique de la demande en mémoire.

Pourquoi la mémoire est devenue le goulot d'étranglement

Chaque accélérateur est équipé d'un montant fixe de mémoire haute vitesse, appelée HBM, qui ne peut pas être étendu. Selon l'analyste, une puce H100 standard ne dispose que de 80 Go, les générations plus récentes offrent jusqu'à 192 Go, et le futur B300 en aura 288 Go. Ce plafond détermine le nombre de requêtes qu'un seul accélérateur peut gérer.

La charge principale ne provient pas des poids du modèle lui-même, mais du cache KV appelé : la mémoire de session qui augmente avec chaque mot généré. Selon les calculs de Zeitgeist, une session avec un contexte de 128 000 jetons nécessite environ 20 Go de mémoire. Seules quatre telles sessions suffisent à épuiser entièrement les ressources d’un seul H100.

Utilisation de la mémoire par session en fonction de la taille de la fenêtre de contexte et du nombre de sessions par accélérateur H100. Source : Zeitgeist

Pour des modèles avancés tels que Claude Opus 4.8 ou GPT-5.5, la demande est encore plus élevée : de 40 Go à 100 Go pour une seule requête longue. Selon l'analyste, c'est pourquoi chaque gigaoctet supplémentaire de mémoire vaut son pesant d'or, tandis que des fabricants tels que Micron et SK Hynix ne peuvent pas physiquement augmenter la production assez rapidement.

L'effet de l'agent IA et le déficit de demande

Selon Zeitgeist, le changement clé réside dans le passage des simples chatbots aux agents IA. Alors qu'une question normale impose presque aucune charge sur la mémoire, un agent qui appelle indépendamment des outils et accumule du contexte peut facilement atteindre 100 000 jetons ou plus. Un seul travailleur connaissances exécutant dix tels agents en parallèle nécessiterait environ 152 Go de mémoire.

Utilisation maximale de la mémoire par travailleur de la connaissance lors de discussions parallèles et de sessions agentes. Source : Zeitgeist

L'analyste a noté qu'il y a environ 250 millions de travailleurs du savoir dans le monde. Si ce chiffre est multiplié par le nombre de sessions agentes simultanées, la demande en mémoire ne se contente pas d'augmenter, elle « explose ». Selon son estimation, avec 100 sessions agentes par personne et par jour, le monde aurait besoin d'environ 60 fois plus de mémoire que ce qui sera produit en 2026.

Zeitgeist a reconnu que les algorithmes réduiront l'utilisation de la mémoire au fil du temps, avec de nouvelles « méthodes d'attention » capables de diviser la charge par quatre à huit. Mais, selon lui, la demande augmente bien plus rapidement : les agents remplacent les discussions simples, les fenêtres de contexte s'étendent de 128 000 à 10 millions de jetons, et l'utilisation de l'IA par chaque employé passe de zéro à des centaines de sessions.

Selon l'analyste, dans un monde où les modèles linguistiques sont « tissés dans chaque aspect de la vie quotidienne », la mémoire devient une ressource critique. Selon sa prévision, les entreprises qui la produisent généreront des revenus sans précédent.

SK Hynix dépasse Samsung à mesure que la demande en mémoire pour l'IA augmente

L'ampleur du boom de la mémoire IA redéfinit déjà le marché des puces. Le fabricant coréen de mémoire SK Hynix a dépassé Samsung en tant que société cotée la plus précieuse du pays, grâce à sa forte position dans les puces de mémoire à large bande passante utilisées pour les charges de travail d'intelligence artificielle.

Pour Zeitgeist, ce changement soutient la thèse plus large selon laquelle les producteurs de mémoire deviennent certains des principaux bénéficiaires de la course à l'infrastructure IA. Alors que la demande de HBM croît plus vite que l'offre, les entreprises capables de produire des puces mémoire avancées pourraient voir leurs revenus et leurs valorisations augmenter fortement.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.