Analyse de la bulle IA : Où se trouvent les risques dans la pyramide à cinq niveaux

Auteur : Block Analytics Ltd X Merkle 3s Capital

Cette question, nous l'avons déjà répondu trois fois

Y a-t-il une bulle dans l'IA ?

C'est la question la plus posée au cours des deux dernières années, et nous l'avons déjà abordée à plusieurs reprises. À chaque fois que nous donnons une conclusion, elle est remise en question par de nouveaux pics et creux.

Cette fois, nous ne prévoyons pas de donner une réponse simple du type « oui » ou « non ».

Parce que la question elle-même est mal posée. L’IA n’est pas un actif ; c’est toute une chaîne industrielle — des fabriques de wafers aux centrales électriques, des géants valorisés des milliards de dollars aux startups venant de lever des fonds. Demander « L’IA a-t-elle une bulle ? » est aussi grossier que de demander « Le marché immobilier a-t-il une bulle ? » : peut-on donner la même réponse pour les quartiers centraux des grandes métropoles et les villes fantômes des petites villes ?

Poser la même question à tous les niveaux conduira inévitablement à une réponse erronée.

La bonne question est : À quel niveau se trouve la bulle de l'IA ?

Les bulles ne demandent jamais « si », elles demandent seulement « où » et « à quel point elles sont épaisses ».

En décomposant cette question, vous verrez une image contraire à l'intuition : tout le monde se concentre sur la couche qu'il craint, qui est précisément la plus sûre ; tandis que les endroits véritablement en ébullition sont rarement discutés sérieusement.

Le fantôme de l'an 2000 : cette fois-ci, quoi de différent ?

Parler de la bulle de l'IA, c'est inévitablement revenir à l'année 2000. Mais la plupart des gens ne se souviennent que « la bulle internet a éclaté », sans se rappeler comment elle a éclaté.

Le scénario de l'époque : d'abord le cours de l'action, puis la recherche de revenus

Le scénario de l'effondrement de l'an 2000 était le suivant : les entreprises de télécommunications avaient contracté des dettes colossales, installé frénétiquement des fibres optiques, comme si elles avaient construit des autoroutes à huit voies dans une ville vide. Les routes étaient terminées, mais où étaient les voitures ? Nulle part. 85 % à 95 % des fibres optiques posées à l'époque étaient « sombres » — enterrées, n'ayant jamais transmis un seul bit. Les actifs figuraient sur les bilans, les revenus étaient nuls, les dettes étaient réelles. Puis, boom.

La fibre optique n'est qu'une histoire de couche infrastructurelle. La couche application est encore plus absurde.

L'entreprise de commerce électronique pour animaux de compagnie la plus célèbre de l'époque n'avait généré que quelques millions de dollars de revenus sur toute l'année de son introduction en bourse, avec des dépenses marketing plusieurs fois supérieures à ses revenus — elle dépensait massivement pour des publicités lors du Super Bowl, perdant de l'argent à chaque vente, et d'autant plus rapidement qu'elle vendait plus. Neuf mois environ après son introduction, elle a été liquidée et a fait faillite. Ce n'était pas un cas isolé ; c'était le profil type standard des applications de cette époque : zéro profit, survie financière grâce au financement, et évaluation basée sur des « regards » et des « clics » plutôt que sur des revenus.

Ce qui est encore plus fantastique, c’est qu’à l’époque, des chercheurs ont calculé qu’une entreprise n’avait qu’à changer son nom en y ajoutant « .com » à la fin, sans modifier le moindre aspect de son activité, pour voir son cours boursier augmenter en moyenne de manière significative.

Le marché paie pour les suffixes, pas pour les affaires.

Revenons sur les « vendeurs de pioches » de l’époque. Cisco était le NVIDIA de l’année 2000 — tout le trafic internet passait par ses routeurs, un raisonnement logique irréprochable. Mais au sommet de la bulle, le PER de Cisco a atteint des chiffres à trois chiffres. Que signifie cela ? Que le marché exigeait qu’elle maintienne ses bénéfices de l’époque pendant plus d’un siècle, ou qu’elle les multiplie par dixaines en quelques années, pour que cet investissement soit rentable. Plus tard, internet a véritablement transformé le monde, et le trafic a explosé — mais il a fallu plus de vingt ans à Cisco pour retrouver son niveau maximal de 2000.

Souvenez-vous de ce cas ; c'est la note la plus importante de l'ensemble du texte :

La plus grande tragédie de l'année n'a pas été d'acheter une fausse entreprise, mais d'acheter une vraie entreprise à cent fois son prix.

Le scénario actuel : d'abord les revenus, puis la hausse du cours de l'action

Maintenant, passez à l’année 2026.

Aucun GPU n’est inactif. Chaque puce produite est branchée sur un rack dès sa sortie de ligne, fonctionnant à pleine capacité pour miner des tokens et générer de l’argent réel. Ce n’est pas une forte utilisation, c’est 100 % — les clients attendent en file avec de l’argent, mais ne peuvent pas en acheter.

Et la couche application ? Comparez avec les principales entreprises de grands modèles. Le revenu annuel d’un des principaux acteurs était il y a 18 mois inférieur à 1 milliard de dollars ; il est aujourd’hui de 45 à 47 milliards de dollars et a déjà atteint la rentabilité trimestrielle. La direction prévoyait une croissance de 10 fois ; en réalité, elle a atteint 80 fois.

Comparer les entreprises leaders des deux ères :

Cette année-là : revenus de plusieurs millions, pertes de plusieurs dizaines de millions, faillite neuf mois après la cotation
Actuellement : les revenus ont été multipliés par des centaines en 18 mois, et les bénéfices ont déjà commencé.

Les entreprises d'autrefois demandaient de l'argent aux marchés financiers grâce à des « histoires » ; les entreprises leaders d'aujourd'hui perçoivent des paiements de leurs clients grâce à des contrats. Ce n'est pas une question de degré, c'est une différence de modèle économique.

Les « vendeurs de pioches » ont également modifié leur logique d'évaluation. Aujourd'hui, le PER d'NVIDIA est d'environ trente fois — seulement une fraction de ce qu'était le pic de Cisco à l'époque. Et cette évaluation n'est pas soutenue par des imaginaires futurs, mais par des commandes déjà signées et intégrées dans les calendriers de production.

Autrefois, on commençait par la cotation boursière, puis on cherchait des revenus — jusqu’à la mort ; aujourd’hui, on commence par les revenus, puis on fait grimper la cotation — et on y arrive. L’ordre est différent, les résultats sont différents.

Les acheteurs ont également changé. Les entreprises de télécommunications qui ont installé des fibres optiques en 2000 avaient emprunté ; aujourd’hui, les acheteurs de puissance de calcul sont Microsoft, Google, Meta et Amazon — les quatre entreprises les plus liquides de la planète, qui dépensent leur propre argent gagné.

L'an 2000, c'était acheter des actifs inutilisés avec de l'argent emprunté ; 2026, c'est acheter des actifs insuffisants avec de l'argent gagné — ce sont deux espèces différentes !

Mais il y a une fente dans le mur

At this point, we must hit the brakes.

L'histoire de ce "cash flow libre" commence à s'effriter. Les quatre grands fournisseurs de cloud ont dépensé environ 725 milliards de dollars en investissements en capital cette année, soit une hausse de 77 % en glissement annuel. À quel niveau cela correspond-il ? C'est à peu près équivalent au PIB annuel d'un pays développé de taille moyenne, injecté dans les centres de données.

Plus frappant encore : Amazon, dont le cash-flow libre est passé de 26 milliards de dollars à 1,2 milliard en ligne droite, presque à zéro, tandis que sa dette à long terme augmente. Autrement dit, les géants ne gagnent plus assez pour couvrir leurs dépenses et commencent à emprunter.

Ce n’est pas un signal de l’éclatement d’une bulle — les bilans des géants restent parmi les plus solides de l’histoire commerciale humaine. Mais c’est la première fissure sur le mur : le raisonnement le plus robuste de cette vague, « les acheteurs de flux de trésorerie », est en train de glisser de « totalement valable » vers « globalement valable ».

Vaut la peine de jeter un coup d'œil chaque trimestre.

Clôturons le bilan de l'année 2000. La plus grande désinformation laissée par cette bulle a été de faire croire à tous que « les histoires étaient fausses », tout en oubliant que ce qui a réellement tué le marché, c'était la perte de contrôle de l'offre : aussi vraie soit-elle, une histoire ne suffit pas si, du côté de l'offre, tout le monde peut augmenter indéfiniment son levier et sa capacité de production — la surcapacité n'est alors qu'une question de temps, et l'effondrement, une question de mathématiques. À l'inverse, pour déterminer si cette vague risque de répéter les erreurs passées, la clé ne réside pas dans la beauté des histoires côté demande, mais dans la capacité de quelqu'un à freiner l'offre.

Cela soulève la question suivante : à qui appartient le frein cette fois-ci ?

Publiez d'abord la carte, puis déminage progressif : la pyramide en cinq niveaux de la puissance de calcul AI

Avant de citer chaque point, tracez d'abord l'ensemble de la chaîne de valeur. La chaîne de valeur de la puissance de calcul IA peut être divisée en cinq niveaux, du bas vers le haut :

Répétez-le avec un tableau :

Ce graphique présente une règle évidente à première vue :

Plus vous êtes proche de la réalité, moins il y a de bulles ; plus vous êtes proche de l'histoire, plus il y a de bulles.

Au niveau L0, augmenter la production prend trois à cinq ans, construire une usine exige des centaines de milliards de dollars, et il est impossible de gonfler une bulle — l'offre ne suit tout simplement pas. Plus on monte, plus les contraintes physiques s'atténuent et plus l'espace narratif s'élargit : au niveau L4, dans la longue traîne, une simple présentation PowerPoint suffit à lever des fonds, et c'est là que les bulles s'accumulent naturellement.

La seule exception est la couche d'interconnexion L2 — elle est pourtant un matériel qui devrait être protégé par des contraintes physiques, mais c'est précisément là que l'effet bulle est le plus prononcé. Pourquoi ? Nous l'analyserons en détail plus tard.

La première étape pour juger de la bulle de l'IA n'est pas d'observer l'humeur du marché, mais de comprendre d'abord à quel niveau de la pyramide vous vous trouvez.

Sur cette carte, la couche L0 ose afficher directement « sans bulle » car elle est verrouillée par deux serrures physiques. D'abord, parlons des serrures, puis déminons couche par couche.

Premier verrou : TSMC

Pourquoi jugeons-nous que cette vague de dépenses en capital dans l'IA ne sera pas hors de contrôle ? La réponse ne se trouve pas du côté de la demande, mais du côté de l'offre.

Une bulle éclate à une condition nécessaire : un excès d'offre. Les tulipes doivent être cultivées partout, les fibres optiques posées sans personne pour les utiliser, les maisons construites sans acheteurs. Pas d'excès, pas de krach. Le véritable coupable du désastre de 2000 n'était pas que l'histoire de l'Internet était mal racontée, mais que l'offre de fibres optiques était complètement hors de contrôle — n'importe quelle entreprise de télécommunications pouvait emprunter pour creuser des tranchées et enterrer des câbles, et personne ne pouvait freiner.

Et l'offre de puissance de calcul AI est entre les mains d'un groupe de personnes parmi les plus conservatrices au monde.

La "banque centrale" de l'ère de l'IA

TSMC détient une part de marché supérieure à 90 % sur les processus avancés, avec un avance d'environ 9 à 15 mois sur Intel et Samsung, et aucun signe de réduction de cet écart sur le processus le plus avancé de 2 nanomètres. Cela signifie une chose : la production mondiale de puces AI n'est pas déterminée par le marché, mais par TSMC.

C’est comme la banque centrale de l’ère de l’IA — la Réserve fédérale contrôle la quantité d’argent imprimée, tandis que TSMC contrôle la quantité de puissance de calcul produite. Pour relever les taux d’intérêt, la Réserve fédérale doit tenir des réunions, voter et faire face à des pressions politiques ; pour contrôler l’offre de puissance de calcul, TSMC n’a qu’à ne pas approuver ses plans d’expansion.

Les dirigeants de cette « banque centrale » sont un groupe d'ingénieurs âgés de plus de soixante-dix ans, ayant vécu les crises de 2001 et de 2008. Ils se considèrent comme les gardiens de l'héritage des fondateurs, ayant eux-mêmes vu comment la bulle des semi-conducteurs s'est formée et a enterré toute l'industrie. Dans leur mémoire, le « krach après un boom » n'est pas un cas d'école, mais des employés licenciés à la main, des lignes de production fermées sous leurs yeux.

Alors, lorsque Huang Renxun est venu demander une doubling ou même un triplement de la capacité de production — ils ont refusé.

Pensez à à quel point cela va à l’encontre du bon sens : l’entreprise la plus en vue de la planète, avec des commandes infinies et des liquidités à profusion, vient vous supplier d’augmenter votre production, et vous dites non. Ce « non », seul une entreprise au monde peut le prononcer, et seule une entreprise au monde peut le décider.

Un détail : Huang Renxun et TSMC collaborent depuis plus de trente ans sans jamais avoir signé un seul contrat d'achat formel. Tout se fait sur une poignée de main. Ce n'est pas une faille de gestion, mais un système forgé par trois décennies de confiance — et c'est aussi la raison pour laquelle TSMC ose dire « non » à son plus grand client, qui ne peut que l'accepter.

À quel point ce verrou est-il serré ?

Au niveau numérique :

Le processus le plus avancé de 2 nanomètres a entièrement vendu sa capacité prévue d'ici la fin de cette année, sans aucun reste.
Taïwan construit simultanément cinq usines de puces de 2 nanomètres — la plus grande construction parallèle d'usines de puces avancées de l'histoire humaine, mais il faut trois à cinq ans pour qu'une usine de puces avancée passe de la construction à la production, avec un investissement initial dépassant 20 milliards de dollars américains.
Même avec une construction aussi intensive, la demande mensuelle prévue pour les puces de 2 nm d'ici 2030 s'élève à 400 000 à 450 000 unités, contre une capacité de seulement 300 000 à 350 000 unités — un déficit structurel de 100 000 à 150 000 unités par mois, soit un quart à un tiers de la demande qui ne pourra jamais être satisfait.

Un autre goulot d'étranglement plus subtil : le conditionnement avancé. Une fois les puces fabriquées, elles ne sont qu’à moitié terminées ; il faut les « conditionner » ensemble avec la mémoire pour les rendre utilisables — c’est le « dernier kilomètre » des puces AI, et ce chemin est lui aussi principalement contrôlé par TSMC, avec une capacité constamment insuffisante.

Si TSMC se libérait complètement, NVIDIA pourrait théoriquement livrer 2 à 3 000 milliards de dollars de GPU par an — un chiffre proche de dix fois le volume actuel réellement livré. C’est TSMC qui a verrouillé ce chiffre.

Toutes les ambitions mondiales en IA doivent faire la queue devant la liste des capacités de TSMC.

Ce cadenas peut également être forcé.

Pour être équitable, il faut aussi clarifier le scénario inverse. Ce verrou n’est pas une machine à mouvement perpétuel : il existe un scénario possible de rupture — si quelqu’un, qu’il s’agisse d’un fou du style Musk ou d’Intel désespéré de se relancer, contourne TSMC et, avec le soutien des équipementiers, construit un cluster de fabriques de puces avancées en interne pour briser le monopole sur la capacité avancée, alors la discipline de l’expansion s’effondrera.

À ce moment-là, chaque fabrique de puces se lancera dans une expansion de capacité comme les entreprises de télécommunications en 2000, et le moteur du surplus d'offre ne s'enclenchera véritablement alors.

La bonne nouvelle : le cycle physique de construction d'usine est ce qu'il est, et ce scénario n'a pratiquement aucune chance de se produire avant 2027. La mauvaise nouvelle : une fois ce scénario lancé, il n'y aura pas de bande-annonce.

Les bulles nécessitent une offre hors de contrôle. Et la vanne d'offre de l'IA est entre les mains d'anciens ayant vécu deux effondrements et ayant rejeté Huang Renxun !

Deuxième verrou : Électricité

Même si TSMC décide demain de doubler sa production, les puces fabriquées auront besoin d’un endroit où être installées.

C'est le deuxième verrou : l'électricité et la terre.

Beaucoup pensent que le goulot d'étranglement de l'infrastructure de l'IA réside dans les puces, mais ce qui bloque réellement aujourd'hui, c'est quelque chose de plus simple : l'approbation des terrains pour les centres de données et leur raccordement au réseau électrique.

L'absurdité de cette situation réside dans le décalage des échelles de temps. Concevoir une puce : deux ans ; construire un centre de données : deux à trois ans ; mais fournir à ce centre de données une alimentation électrique suffisante — construire une nouvelle centrale, étendre les sous-stations, installer des lignes de transport à haute tension, accomplir toutes les évaluations environnementales et obtentions d'autorisations — prend au minimum cinq ans. Les puces évoluent par nanomètres, tandis que le réseau électrique est planifié sur des décennies.

Les puces évoluent mensuellement, tandis que les réseaux électriques évoluent sur des décennies — c'est le plus grand décalage temporel de l'ère de l'IA.

Vous verrez donc un spectacle étrange : des géants de la technologie disposant de budgets de plusieurs centaines de milliards de dollars, cherchant partout dans le monde des terres « électriques », comme des chercheurs d’or cherchent de l’eau. Ils achètent des terrains à côté de centrales nucléaires, signent des contrats d’achat d’électricité sur vingt ans, ou financent directement la remise en service de réacteurs nucléaires désaffectés. L’argent n’est pas un problème, l’électricité l’est.

Le déficit énergétique devrait s'atténuer progressivement d'ici 2027-2028 — le calendrier de construction des centrales électriques et du réseau électrique détermine ce délai, et aucun montant d'argent ne pourra le réduire significativement.

Deux serrures superposées ont pour effet : la croissance de la puissance de calcul IA est artificiellement « aplatie ». La demande veut exploser, tandis que l'offre ne peut que progresser lentement. La croissance devient ainsi plus lente, mais aussi plus longue et plus stable — un traitement que n'ont jamais connu les révolutions technologiques historiques comme les chemins de fer, les canaux ou Internet. Elles ont toutes connu une offre qui s'est d'abord déréglée, puis s'est effondrée.

Chaque révolution technologique de l'histoire est morte à cause d'une offre hors de contrôle. L'IA est la première à être contrainte par les lois physiques — c'est sa plus grande chance.

Une variable venue de l'espace

Laissez une variable à long terme : centre de données spatial.

La logique est science-fiction mais solide — dans une orbite synchrone avec le Soleil, l'énergie solaire est infinie et gratuite ; le côté sombre du satellite fait face à l'espace profond à plus de deux cents degrés Celsius en dessous de zéro, ce qui permet un refroidissement presque sans coût. La forme envisagée est la suivante : à l'avant, des panneaux solaires ; au milieu, des baies de serveurs standard ; à l'arrière, un radiateur de plusieurs dizaines de mètres de long. Plusieurs satellites sont interconnectés par laser pour former un centre de données virtuel flottant en orbite.

Les deux éléments les plus coûteux dans les centres de données au sol — l'électricité et le refroidissement — sont gratuits dans l'espace.

Calendrier : Une preuve de concept pourrait être observée dans les deux prochaines années, et vers 2030, l'approche d'investissement dans les centres de données au sol pourrait commencer à être remise en question.

Mémoïsez cette variable. Elle ne change rien pour le moment, mais elle est une épée de Damoclès au-dessus de la couche d’infrastructure L3 — elle sera utilisée dans les paragraphes suivants.

Où se trouvent réellement les bulles : déminer progressivement chaque niveau de la pyramide

Les deux verrous ont été expliqués ; revenons à la carte en cinq niveaux et passons en revue chaque niveau du bas vers le haut.

L0 + En-tête de la couche application : Large cap — Cher, mais pas une bulle

Microsoft, Google, Meta, Amazon, NVIDIA. Les dépenses en capital à ce niveau correspondent à des contrats réels, des revenus réels et une utilisation à pleine capacité.

Deux chiffres suffisent.

Le premier : les commandes signées mais non encore exécutées d'AWS ont atteint 360 à 370 milliards de dollars au premier trimestre, soit une augmentation de plus de 90 % en glissement annuel — sans compter les 100 milliards de dollars supplémentaires promis ultérieurement par un laboratoire d'IA de premier plan. Quelle est la portée de cela ? Cela signifie qu'AWS dispose, même s'il ne signe aucun nouveau client à partir d'aujourd'hui, de suffisamment de contrats signés pour lui assurer un volume de travail pendant plusieurs années. Ce ne sont pas des prévisions, ce sont des contrats signés.

Deuxième : l'entreprise leader en modèles de grande taille mentionnée précédemment — en 18 mois, ses revenus sont passés de moins de 1 milliard à plus de 45 milliards, et elle est désormais rentable trimestrielle. Ce taux de croissance n'a aucun équivalent dans l'histoire commerciale humaine.

Il y a un coût que peu de gens prennent en compte : l’économie de l’inférence. Former un modèle de pointe est un investissement pur, qui consomme des fonds sans retenue ; mais une fois le modèle formé, chaque appel et chaque token généré rapporte. Selon les estimations actuelles de l’industrie, les revenus potentiels générés par l’inférence sur l’ensemble du cycle de vie d’un modèle sont environ 5 à 10 fois supérieurs à son investissement initial en pré-entraînement. Autrement dit, ces dépenses de capital astronomiques d’aujourd’hui ne financent pas un produit unique — le modèle — mais une « péage de calcul » qui générera des revenus pendant de nombreuses années à venir.

Le modèle de péage a une particularité : les investissements initiaux sont effrayants, mais les flux de trésorerie ultérieurs sont écrasants. Les autoroutes, les réseaux électriques et les réseaux de télécommunications fonctionnent ainsi — à condition qu'il y ait vraiment des véhicules qui circulent. Et nous avons déjà vérifié : aucun GPU n'est inactif, chaque voie est pleine.

Cher ? Oui. Est-ce une bulle ? Une bulle est définie comme un prix qui s'éloigne des fondamentaux, mais ici, les fondamentaux rattrapent le prix à un rythme de 80 fois tous les 18 mois.

À l'époque, la valorisation attendait patiemment les revenus, jusqu'à la faillite ; aujourd'hui, les revenus rattrapent la valorisation, et ils y parviennent.

Les acheteurs de cette couche n'achètent pas de puissance de minage en pariant sur une histoire, mais parce qu'ils n'ont aucun autre choix face à des commandes déjà signées ; sans expansion, ils ne pourront pas honorer leurs contrats — il s'agit d'investissements en capital poussés par la demande, et non tirés par des illusions.

Couche de mémoire L1 : zone de combat entre longs et courts

Étape supérieure : puces de stockage. C'est le champ de bataille actuel où les divergences entre les négociants haussiers et baissiers sont les plus aiguës.

Expliquons d'abord pourquoi cette couche est importante. Si le GPU est le cuisinier, la mémoire (notamment la mémoire à haut débit HBM) est la planche de préparation — peu importe à quelle vitesse le cuisinier découpe, si les ingrédients ne lui sont pas livrés à temps, c'est inutile. L'inférence IA est précisément une tâche qui consomme énormément de "vitesse de préparation" : plus le modèle est grand et plus la conversation est longue, plus la demande en bande passante mémoire augmente plus rapidement que celle en puissance de calcul.

La situation actuelle : les prix de la mémoire ont augmenté de 60 à 70 % en un an, et la marge bénéficiaire de Micron est passée de 16 % en moyenne historique à 70 %.

Regardez à quel point ce chiffre est effrayant dans l’historique : au cours des vingt-cinq dernières années, l’industrie de la mémoire a été célèbre pour son « cycle du porc » — prix à la hausse, expansion frénétique, excès d’offre, effondrement des prix, pertes collectives, en boucle. Chaque fois qu’un niveau de marge de 70 % apparaît dans ce secteur, il est suivi d’un enterrement. Selon le scénario traditionnel, il faudrait maintenant vendre tout et s’en aller.

Mais la logique des acheteurs est la suivante : cette demande n'est pas une simple reconstruction de stocks, elle est structurelle. La demande en HBM pour l'inférence IA continuera d'augmenter de manière soutenue, et les fabricants de mémoire, ayant appris des leçons des cycles passés pendant vingt-cinq ans, s'apprêtent à étendre leur production avec une extrême prudence — personne ne veut être celui qui fait effondrer les prix.

Il y a un changement structurel méritant une mention séparée : après vingt-cinq ans de redressements sanglants, le marché mondial de la mémoire haut de gamme ne compte plus que trois acteurs. Dans les années 1990, ce secteur comptait plus de vingt fabricants, et les guerres de prix étaient incontrôlables ; aujourd'hui, ces trois oligopoles se surveillent mutuellement à travers le Pacifique, chacun hésitant à agir en premier. La structure oligopolistique impose naturellement une discipline de capacité — c'est la raison structurelle la plus solide pour affirmer que « cette expansion ne dégénérera pas », bien plus fiable que toute déclaration de la direction.

De plus, HBM occupe discrètement une part de la capacité de production de la mémoire classique : sur une même ligne de production, les wafers affectés à HBM génèrent une quantité bien inférieure de mémoire classique. Plus la demande pour HBM augmente, plus l'offre de mémoire classique se resserre, faisant grimper les prix dans tout le secteur — c’est pourquoi les prix des barrettes de mémoire classique dans votre ordinateur augmentent également.

Un chiffre encore plus important : actuellement, environ 0,1 % de la population mondiale utilise réellement l'IA correctement. Si ce chiffre atteint 5 % — c’est-à-dire si l’IA passe d’un « jouet de geeks » à un « outil quotidien pour les employés de bureau » — le plafond de la demande en mémoire se situe au-delà des nuages.

Le raisonnement des vendeurs à découvert est tout aussi solide : la hausse actuelle des prix est entraînée par les prix eux-mêmes, et non par les volumes de vente — le stockage, la réticence à vendre, l'achat à la hausse mais pas à la baisse : ce sont là des signes typiques d'un déséquilibre entre l'offre et la demande, et non une manifestation d'une demande saine.

Un taux de marge de 70 % est soit le début d'une nouvelle ère, soit le point culminant d'un vieux scénario. Les acheteurs parient sur « cette fois, c'est différent » — et ces cinq mots sont précisément les cinq mots les plus chers de l'histoire de l'investissement.

Nous ne tirons pas de conclusion sur ce niveau. C’est une table de jeu, pas une bulle, et les deux côtés ont des jetons réels.

Couche d'interconnexion L2 : modules optiques — le goût de la bulle commence ici

Enfin, nous arrivons à l’endroit où nous voulons vraiment attirer votre attention. C’est aussi la seule « exception matérielle » sur cette carte.

En trente secondes, voici ce qu’est un module optique : Dans un centre de données AI, il y a des dizaines de milliers de GPU qui ne travaillent pas isolément, mais échangent constamment des données pour collaborer au calcul d’un même modèle — le volume de communication entre les puces est tel que les câbles en cuivre ne peuvent plus le supporter ; il faut donc convertir les signaux électriques en signaux optiques pour les transmettre via des fibres. La petite boîte chargée de convertir l’électrique en optique, et inversement, c’est le module optique.

Le GPU est le muscle, les modules optiques sont les vaisseaux sanguins. Plus la taille du cluster est grande, plus la demande d'interconnexion entre les puces augmente de manière quadratique — plus l'IA est populaire, plus les modules optiques connaissent une explosion. Ce raisonnement industriel est réel : le marché mondial des modules optiques devrait croître de près de 60 % cette année, et la capacité est effectivement « épuisée jusqu'en 2028 ».

C'est logique. Mais examinons ce que les cours ont fait, une entreprise à la fois.

Première entreprise : Lumentum — l'enfant de la précédente bulle, le leader de celle-ci

Cette entreprise fabrique des lasers et des composants optiques, autrement dit, la « source lumineuse » la plus cruciale dans les modules optiques et les systèmes de communication optique. Son histoire est particulièrement intéressante : son prédécesseur était l'une des actions les plus célèbres de la bulle des télécoms optiques en 2000 — cette entreprise avait atteint une capitalisation boursière de plusieurs centaines de milliards de dollars, puis avait perdu 99 % de sa valeur à la rupture de la bulle, devenant l'exemple type des « bulles d'infrastructures » dans les manuels. Lumentum est issue de la scission de cette entreprise.

Pendant les vingt années intermédiaires, elle a vécu une existence banale : fournir des lasers pour la reconnaissance faciale des iPhone et des composants pour les réseaux de télécommunications, c'était une entreprise typique de matériel « bien mais ennuyeux ».

Ensuite, l'IA est arrivée. Les centres de données nécessitent une quantité massive de lasers à haute vitesse, et la nouvelle approche technologique consistant à « intégrer directement les chemins optiques dans les commutateurs » l'a de nouveau placée au centre de la scène, poussant même NVIDIA à investir 2 milliards de dollars dedans. Résultat : au cours des 12 derniers mois, le cours de l'action a augmenté de plus de dix fois.

Les affaires s'améliorent-elles ? Oui, vraiment. Les commandes sont prises jusqu'en 2028, c'est concret. Mais mettez ces deux chiffres ensemble : ses prévisions de croissance du revenu prévoient une augmentation annuelle de plusieurs dizaines de pourcents ces prochaines années, tandis que son cours boursier a augmenté de plus de 1 000 % en un an. Le marché lui attribue une valorisation équivalente à plusieurs dizaines de fois son revenu annuel — alors que le niveau normal pour une entreprise mature du secteur matériel se situe entre trois et cinq fois son revenu.

Au cœur de la précédente bulle, c'était la lumière ; cette fois-ci, l'endroit qui sent le plus la bulle, c'est encore la lumière. L'histoire ne se répète pas, mais elle rime vraiment.

Deuxième entreprise : AAOI — Celui qui est déjà tombé se retrouve de nouveau au bord du même précipice

Cette entreprise fabrique des modules optiques de transmission complets, principalement vendus aux centres de données des fournisseurs de cloud. Son histoire est tout aussi intéressante : lors de la précédente vague de construction de centres de données (autour de 2017), elle avait également été une action phare — jusqu'à ce que son plus grand client annule soudainement ses commandes pour se tourner vers un autre fournisseur, faisant chuter son cours de 90 % au cours des deux années suivantes, puis la plongeant dans une lutte prolongée de sept à huit ans pour éviter la faillite.

Ensuite, l'IA est arrivée, la demande pour les nouveaux modules optiques à haute vitesse a explosé, et les anciens clients sont revenus. Résultat : le cours de l'action a plus que quadruplé cette année.

Faites attention à la différence entre cette entreprise et Lumentum : Lumentum est au moins un leader du secteur, avec un avantage technologique et le soutien de NVIDIA ; AAOI est un fabricant de deuxième niveau qui n’a pas été rentable pendant la majeure partie des dix dernières années, avec une concentration extrême de clients et déjà confronté à une réduction de commandes lors du cycle précédent. Sa forte hausse est presque entièrement due à la poussée du courant sectoriel.

Mais la marée commence à bouger. Le mois dernier, ce secteur a connu plus d'une seule baisse journalière à deux chiffres — AAOI a chuté de plus de 10 % en une journée, et les leaders ont suivi avec une baisse de 7 à 10 %. Aucun fondamental négatif, simplement une prise de bénéfices en haut.

Il existe un autre risque rarement discuté : la voie technologique elle-même.

Une révolution architecturale est en cours dans l'industrie : intégrer directement les composants optiques dans le package des puces, plutôt que de les utiliser comme de petits boîtiers indépendants plug-in sur les commutateurs — ce qu'on appelle l'optique co-embarquée. Dès que cette approche deviendra dominante, deux choses se produiront : premièrement, le « module optique » en tant que produit indépendant sera progressivement absorbé, et le contrôle passera des fabricants de modules aux géants des puces ; deuxièmement, la valeur de la chaîne se concentrera sur les « sources lumineuses centrales », tandis que les marges des étapes d'assemblage seront érodées.

Cette révolution technologique représente une opportunité supérieure au risque pour des entreprises comme Lumentum, qui maîtrisent les lasers — la source lumineuse reste toujours indispensable et devient même plus précieuse ; mais elle constitue une deuxième lame au-dessus de la tête pour des fabricants de modules comme AAOI, spécialisés dans l’assemblage. Ironiquement, le marché accorde aujourd’hui une même ardeur de valorisation à ces deux types d’entreprises — lorsqu’il y a une grande marée, personne ne vérifie si quelqu’un porte un maillot de bain ou non.

Dans le même secteur, certains vendent des sources de lumière non fongibles, d'autres vendent des boîtiers pouvant être contournés par une révolution architecturale — et pourtant, la hausse des cours ne montre aucune différence. Cela en soi est un signe de bulle.

Calculez le total de cette couche : la demande a augmenté de près de 60 %, et le cours de l'action a quadruplé à décuplé. Quelle est la différence entre les deux ? Le marché a actualisé les revenus de 2028 dans le cours de l'action de 2026.

Le bon récit, associé à une surévaluation excessive — telle est la forme standard d'une bulle. Pas fausse, simplement trop chère pour laisser la moindre marge d'erreur pour l'avenir.

Pourquoi précisément cette couche fait-elle émerger une bulle ? La règle de cette carte le révèle : les modules optiques constituent la partie de la chaîne matérielle avec le plus bas seuil physique d’entrée. Construire une usine de wafers exige des centaines de milliards de dollars et cinq ans, tandis que l’expansion d’une ligne de production de modules optiques ne nécessite que quelques milliards de dollars et quelques trimestres — c’est la seule section de la chaîne dont l’offre peut « suivre » la spéculation. L’offre n’étant pas maîtrisable, la bulle trouve des fissures pour se développer.

La protection par verrouillage de TSMC ne protège pas les modules optiques — car la capacité de production des modules optiques est précisément le seul maillon de la chaîne qui n'a pas besoin de l'approbation de TSMC.

Les baisses à deux chiffres en une journée se répètent, ce qui indique que l'argent intelligent commence à faire la file à la porte.

Couche d’infrastructure L3 : Sous-loueur de GPU dans le cloud — en vie, mais grâce aux goulots d’étranglement des autres

Ces deux dernières années, de nouveaux fournisseurs de cloud spécialisés dans la location de GPU ont émergé : ils achètent eux-mêmes les cartes, construisent leurs propres data centers, puis louent la puissance de calcul aux entreprises qui manquent de cartes. Dans l'industrie, on les appelle NeoCloud — nous préférons les appeler « sous-locataires de GPU ».

Ils s'en sortent très bien et ont vraiment deux bonnes méthodes : ces gens exploitent le matériel comme des pilotes de F1 pilotent une voiture de course, atteignant une utilisation réelle du GPU 2 à 3 fois supérieure à celle des fournisseurs traditionnels de deuxième niveau. Avec les mêmes cartes, ils génèrent plus de revenus.

Le raisonnement tient également : les quatre grands fournisseurs de cloud n'ont tout simplement pas assez de capacité propre ; la demande excédentaire doit être prise en charge par quelqu'un. Tant que le prérequis majeur de « pénurie de puissance de calcul » persiste, les sous-locataires ont des opportunités d'affaires.

Mais notez la nature même de cet entreprise : elles sont des bénéficiaires des goulets d'étranglement, pas des détenteurs de avantages concurrentiels.

Réfléchissez bien à leur situation : chaque dollar qu’ils gagnent provient essentiellement du décalage temporel causé par le fait que les grands acteurs n’ont pas pu suivre l’expansion. Mais — la contrainte énergétique devrait être allégée entre 2027 et 2028 ; les centres de données propriétaires des grands acteurs sont construits à la vitesse la plus rapide de l’histoire humaine ; et ce précédent, le centre de données spatial, si jamais il voit le jour dans les années 2030, sous-minera la logique de rareté des ressources de calcul terrestres.

L'écart de temps va se fermer. Le sous-locataire ne possède pas le certificat de propriété, seulement un contrat de location dont la date d'expiration est inconnue.

De plus, ce métier présente un défaut structurel : la concentration élevée des clients et des ressources essentielles. Leurs cartes proviennent toutes du même géant des puces, les grands clients se réduisent souvent à deux ou trois entreprises d’IA, et certains acteurs ont le même nom pour leur principal actionnaire et leur principal fournisseur. En amont, on contrôle votre source d’approvisionnement ; en aval, on contrôle vos revenus ; et vous, au milieu, gagnez de l’argent grâce à l’écart temporel de négociation — ce type d’activité peut être très rentable, mais ne justifie pas une évaluation de type « plateforme ».

Gagner de l'argent grâce aux goulets d'étranglement des autres, c'est se préparer à la journée où ces goulets disparaîtront.

Ce niveau n'est pas une arnaque, les flux de trésorerie d'aujourd'hui sont réels. Mais la valorisation élevée que le marché leur accorde actuellement suppose la pérennisation d'un état temporaire — c'est une erreur de valorisation qui tend vers une bulle.

Couche d'application L4 : long tail + écosystème VC : le lieu où les signaux de bulle sont les plus forts

Dernièrement, gravir le sommet de la pyramide. Cette couche doit être divisée en deux parties à analyser.

La moitié supérieure — quelques entreprises de grands modèles ayant un revenu réel — a déjà été mentionnée précédemment : leurs revenus suivent leur valorisation, pas de développement supplémentaire.

La vraie question réside dans la longue traîne et l'écosystème de VC qui alimente la longue traîne. Les chiffres les plus frappants se trouvent ici :

Au premier trimestre de cette année, les entreprises d'IA ont capté la majorité des investissements de risque mondiaux — plus de 8 dollars sur 10 de financement VC ont été orientés vers l'IA.

En 1999, au plus fort de la bulle internet, quel était ce pourcentage ? Environ un tiers à 40 %.

Autrement dit, la concentration des investissements des VC sur un seul thème aujourd'hui est deux fois supérieure au pic de la plus grande bulle de l'histoire humaine.

Et la structure est extrêmement déséquilibrée : seulement quatre grandes opérations ont absorbé 65 % du total des investissements de capital-risque mondiaux pour le trimestre. Les deux tiers des investissements de capital-risque mondiaux pour un trimestre se sont retrouvés dans les comptes de quatre entreprises.

Cela crée une chaîne de transmission : les entreprises phares, soutenues par des revenus réels, bénéficient de valorisations exorbitantes — ce qui n'est pas un problème ; mais des milliers d'entreprises de la longue traîne, sans revenus, empruntent la logique de valorisation des leaders pour s'évaluer elles-mêmes : « Cette entreprise a multiplié sa valeur par 80 en 18 mois, pourquoi pas moi ? » — voilà le véritable problème. Le jeu de 1999 « Ajoutez un .com et ça monte » a pour version actuelle « Ajoutez un AI Agent et ça double ».

Ce qui est encore plus problématique, c’est que la manière dont ces entreprises à longue traîne vont mourir peut déjà être anticipée. Elles ne mourront pas à cause d’un échec produit — le produit pourrait même être bon. Elles mourront à cause d’une inversion de valorisation : l’argent levé lors du dernier tour à un prix spéculatif est épuisé, et les investisseurs du prochain tour ne veulent plus payer qu’un prix réaliste ; or, lever des fonds à un prix réaliste signifie que les investisseurs du tour précédent subiront d’énormes pertes et que les fondateurs verront leurs actions réduites à zéro — ce qui bloque les négociations, piégeant l’entreprise entre « la dignité de la valorisation » et « la survie », jusqu’à ce que son solde bancaire atteigne zéro. La plupart des entreprises de 1999 sont mortes ainsi : non pas tuées par le marché, mais étouffées par leur propre valorisation du tour précédent.

Un autre facteur d'amplification : la structure de coûts de ces entreprises de la longue traîne est plus fragile qu'en 1999. À l'époque, les startups internet brûlaient des frais de marché ; supprimer la publicité permettait encore de survivre. Aujourd'hui, les startups d'IA brûlent des factures de puissance de calcul — sans invocation du modèle, le produit s'arrête, et ce coût est incompressible. Le revenu est une histoire, les coûts sont rigides ; cette combinaison accélère la mort en période de retrait des capitaux par rapport à la précédente vague.

Notez que cela ne contredit pas l'idée que « les grandes capitalisations n'ont pas de bulle » —

Les grandes entreprises ont des revenus réels pour les soutenir, tandis que les petites n'ont que des histoires pour les soutenir. Les bulles ne se trouvent jamais dans les plus grandes entreprises, mais dans les petites entreprises qui se valorisent selon la logique d'évaluation des plus grandes.

Souvenez-vous de la vraie leçon de 1999 ? Ce n’est pas « Internet est une illusion » — Internet est réel, le commerce électronique est réel, le plus grand acteur du commerce électronique a survécu et domine le monde. La leçon est :

Dans une véritable révolution technologique, vous pouvez quand même perdre tout votre argent — tant que vous avez choisi la mauvaise couche.

Les vendeurs à découvert ne se trompent pas entièrement : deux lignes d'attaque à considérer avant de dormir

En écrivant ceci, si vous pensez que nous sommes des hausseurs aveugles, continuez à lire. Il y a de la substance chez les baissiers, et cette substance est plus tranchante que ce que la plupart des hausseurs sont prêts à admettre.

Les vendeurs à découvert ont deux lignes d'attaque principales. Apparemment, il s'agit de deux sujets, mais en creusant plus profondément, vous découvrirez qu'ils ne font qu'une seule et même question sous deux aspects.

Ligne d'attaque 1 : La guerre de l'amortissement — Combien de temps votre GPU peut-il vraiment durer ?

Commencez par expliquer la "dépréciation" avec un exemple de la vie courante.

Supposons que vous conduisiez pour une plateforme de covoiturage et que vous ayez dépensé 300 000 yuans pour acheter la voiture. Si vous amortissez le véhicule sur 3 ans, le coût annuel s'élève à 100 000 yuans ; si vous l'amortissez sur 6 ans, le coût annuel n'est plus que de 50 000 yuans. Notez : vous ne gagnez pas un yuan de plus, la voiture reste la même, mais en modifiant simplement une hypothèse comptable, votre bénéfice comptable augmente artificiellement de 50 000 yuans par an.

Maintenant, remplacez la voiture par une GPU et 300 000 par plusieurs centaines de milliards de dollars.

Les géants de la technologie effectuent collectivement la même opération : allonger la durée d'amortissement des GPU. Autrefois estimée à 3 à 4 ans, elle est désormais prolongée à 5 ou 6 ans. Chaque année supplémentaire améliore sensiblement le bénéfice courant. Selon les calculs des vendeurs à découvert, cette modification pourrait entraîner une réduction de plusieurs centaines de milliards de dollars américains des amortissements sur les trois prochaines années pour l'ensemble du secteur, faisant ainsi surestimer le bénéfice courant de certains géants de plus de 20 %.

Qu'est-ce que vingt pour cent signifie ? Cela signifie que jusqu'à un cinquième des bénéfices affichés dans vos états financiers pourraient être « un cadeau des hypothèses comptables » et non le résultat direct de votre activité.

Les arguments des porteurs sont également valables : la durée d'amortissement n'a pas été modifiée arbitrairement. Dans les scénarios d'inférence, les anciennes GPU sont tout à fait performantes — entraîner des modèles de pointe nécessite des cartes récentes, mais utiliser des cartes de trois ans pour des inférences quotidiennes permet toujours d'exploiter pleinement leur capacité et de générer des bénéfices. Selon cette logique, il n'est pas exagéré d'utiliser des GPU pendant 10 ou 15 ans ; amortir sur 3 ans était en fait une sous-estimation.

Qui a raison ? La réponse honnête : cela dépend de NVIDIA elle-même. Plus les prochaines générations de produits affichent des sauts de performance importants, plus les cartes anciennes se déprécient rapidement, et plus les vendeurs à découvert ont raison ; plus les sauts sont modérés, plus les cartes anciennes ont une longue durée de vie, et plus les acheteurs ont raison. Chaque fois que NVIDIA lance une nouvelle génération de produits, elle vote pour le bilan de ses clients.

C'est le moment le plus ironique des problèmes financiers liés à l'IA : plus les produits d'NVIDIA réussissent, plus les états financiers de leurs clients deviennent suspects.

Deuxième ligne d'attaque : Crédit GPU — déplacer la dette hors de la vue

La deuxième ligne d'attaque a été mise à jour et est désormais plus discrète. Peu de personnes en discutent sur le marché, mais nous pensons qu'elle est d'un ordre de grandeur plus grave que le problème de dépréciation.

Des GPU ont déjà commencé à circuler via des structures hors bilan complexes. En les analysant, ce mécanisme fonctionne ainsi :

Créer une coquille : constituer spécifiquement un véhicule à objet spécial (SPV) — une société coquille dont la seule activité est de détenir des GPU.
Shell borrows money: Shell companies borrow from private credit funds to purchase thousands of GPUs
Louer aux utilisateurs de cartes : les sociétés écrans louent à long terme des GPU à des entreprises d’IA, perçoivent des loyers et utilisent ces revenus pour rembourser les prêts.
Les vendeurs de cartes rejoignent l’équipe : le meilleur point, c’est que les fabricants de puces investissent eux-mêmes dans la société écran, devenant ainsi des investisseurs ancrés.

Chaque partie a obtenu ce qu'elle voulait : l'entreprise d'IA a obtenu les cartes sans contracter de dette ; les géants et les entreprises d'IA n'ont pas enregistré cette dette sur leurs bilans ; le fabricant de puces a sécurisé ses ventes et a également réalisé des gains d'investissement ; le fonds de crédit privé a obtenu des actifs à haut rendement.

Quatre parties gagnantes. Il n'y a qu'un petit problème : la dette n'a pas disparu, elle est simplement invisible.

Cette structure devrait te rappeler quelque chose. En fait, elle résonne avec deux périodes historiques à la fois.

La première période est l'année 2000. Peu de gens se souviennent qu'à l'époque de la bulle des télécoms, un acteur clé avait contribué à l'emballement : le financement par les fabricants. Les géants de l'équipement empruntaient eux-mêmes de l'argent pour le prêter à leurs clients, afin que ces derniers achètent leurs propres équipements. Sur les comptes, les ventes semblaient flamber et la courbe de croissance était parfaite, mais en réalité, il s'agissait simplement d'un transfert d'argent de la main gauche à la main droite — les clients utilisaient l'argent des fabricants pour acheter leurs produits. Lorsque la bulle a éclaté, ces fabricants ne détenaient pas de profits, mais une multitude de créances impayées, et ils ont disparu plus cruellement que quiconque. Aujourd'hui, la structure selon laquelle les fabricants de puces investissent de l'argent dans des sociétés écrans, qui utilisent cet argent pour acheter des puces, est le frère jumeau, sur le plan génétique, du financement par les fabricants d'alors.

La deuxième fois, c'était en 2008. La dernière fois que l'ensemble du système financier s'était engagé dans l'« emballage, la stratification et le déplacement des risques vers des endroits invisibles pour les régulateurs et les investisseurs », c'était la titrisation des prêts hypothécaires avant la crise. À l'époque, ce qui était emballé, c'étaient les maisons ; aujourd'hui, ce sont les GPU.

Lorsqu'une industrie commence à payer ses propres clients pour acheter ses produits, chaque chiffre de croissance que vous voyez doit être mis en doute.

L'amortissement est une question comptable, et les questions comptables n'ont jamais percé de bulles ; le levier est une question financière, et historiquement, chaque bulle a été percée par une question financière.

Les deux lignes ne font en réalité qu'une seule ligne.

En reliant les deux lignes d'attaque, vous verrez la véritable puissance du raisonnement vendeur.

La nature du débat sur l'amortissement réside dans la durée de vie des GPU et leur valeur résiduelle.

Quelle est la garantie du crédit GPU ? La valeur résiduelle du GPU.

Autrement dit : la base sur laquelle les sociétés écrans empruntent des dizaines de milliards de dollars est l'hypothèse selon laquelle « ces GPU conserveront leur valeur et généreront des revenus locatifs pendant de nombreuses années ». Si la prochaine génération de produits d’NVIDIA offre une performance encore supérieure, les loyers des cartes anciennes chuteront brutalement — les premières à faire faillite ne seront pas les géants (qui peuvent résister), mais ces sociétés écrans ainsi que les fonds de crédit privé qui leur ont prêté de l’argent.

La question que vous devrez alors vous poser est : de combien le crédit privé a-t-il augmenté ces dernières années ? Et combien d'autres éléments y ont-ils été intégrés ? Ce sera l'objet d'un autre article.

La taille actuelle de cette structure est encore petite, bien insuffisante pour causer un problème systémique — c’est la vérité. Mais même les plus ardents acheteurs listent « l’endettement massif par hypothèque de GPU » comme le premier signal d’alerte de ce cycle. Lorsque les acheteurs et les vendeurs pointent rarement du doigt le même endroit en disant « regardez là », cet endroit mérite votre attention sérieuse.

À l'instant où l'on a glissé la GPU dans le boîtier de la société, 2026 a pour la première fois commencé à sentir un peu 2008. Ce n'est encore qu'une légère senteur — surveillez la vitesse à laquelle elle s'intensifie.

Conclusion : Cher, mais la porte est toujours verrouillée

Réduire l'ensemble en une seule image : toujours cette pyramide :

Sans bulle (L0 + L4 leaders) : TSMC, NVIDIA, les quatre grands fournisseurs de cloud, les principales entreprises de modèles de grande taille. Contrats réels, revenus réels, taux d’utilisation à pleine capacité, accompagnés des deux verrous physiques que sont TSMC et le réseau électrique. Cher, mais cher ne signifie pas bulle.

L1 : Mémoire. Un taux de marge de 70 % est soit le début d'un nouveau cycle structurel, soit le point culminant d'un scénario ancien ; la table de jeu est déjà prête.

Avec un goût de bulle (L2, L3, L4 long tail) : les modules optiques — le seul maillon de la chaîne matérielle non protégé par la discipline de capacité de TSMC, valorisé sur les revenus de 2028 pour l'année 2026 ; les sous-location de GPU — transformant une gêne temporaire en avantage concurrentiel permanent ; l'écosystème des fonds de capital-risque — une concentration sur un seul thème atteignant deux fois le pic de 1999, les startups long tail utilisant la logique de valorisation des leaders pour fixer leurs prix.

Les trois points potentiels à surveiller :

Révolution de l'efficacité algorithmique. Si un jour, des algorithmes plus intelligents atteignent le même résultat avec un dixième de la puissance de calcul, toute la logique des dépenses en capital basée sur « l'accumulation de puissance de calcul » s'effondre du jour au lendemain. C'est le scénario le moins probable, mais le plus destructeur.
Levier sur les GPU. Une fois déployées, les structures hors bilan, le financement garanti et la titrisation transforment les acheteurs de flux de trésorerie en acheteurs leviers, faisant revivre le scénario de 2000 avec le moteur de 2008. C’est celui qui présente actuellement les signes les plus réels.
TSMC abandonne la prudence. Que ce soit en étant dépassée par ses concurrents ou en changeant d'avis pour une expansion folle — le moment où l'offre échappe au contrôle, c'est là que les conditions nécessaires à une bulle sont véritablement réunies. C'est celui qui nécessite le suivi le plus à long terme.

Avant que ces trois choses n'arrivent, l'IA était une révolution technologique dont le rythme était imposé par les lois physiques : coûteuse, surpeuplée, localement fiévreuse, mais avec une base solide.

Enfin, transformez cette carte en trois questions que vous pouvez emporter avec vous. La prochaine fois que vous verrez n'importe quel actif IA, qu'il s'agisse d'actions ou d'un projet de start-up, posez-vous d'abord la question :

Première question : À quel niveau de la pyramide se trouve-t-il ? Plus proche du physique, plus sûr ; plus proche de l'histoire, plus dangereux. Celui qui ne peut pas préciser son niveau est par défaut placé au niveau le plus dangereux.

Deuxième question : Ses revenus sont-ils réels, ou empruntés à la valorisation des entreprises leaders ? La fréquence d'apparition des quatre mots « comparé à telle entreprise » est proportionnelle à la concentration de bulle.

Troisième question : gagne-t-il de l’argent sur la structure ou sur le goulot d’étranglement ? L’argent issu de la structure peut être généré pendant de nombreuses années, tandis que l’argent issu du goulot d’étranglement a une date de péremption — et cette date de péremption est généralement bien plus courte que la période implicite dans l’évaluation.

Répondez à ces trois questions avant de parler prix.

Les bulles ne vous avertissent jamais à quel niveau elles éclatent. Mais vous pouvez au moins choisir de ne pas vous tenir au niveau où l'on vous fixe une valeur à partir des histoires des autres.

La prochaine fois que quelqu’un te demande « L’IA est-elle une bulle ? », tu peux lui répondre : « Laquelle ? »

Les ingénieurs âgés de plus de soixante-dix ans de TSMC pourraient être les seuls sur cette planète à pouvoir empêcher la bulle de l'IA. Pour l'instant, ils sont toujours en poste.