qinbaFrank analyse les tendances de l'infrastructure informatique IA, les cycles du marché et la logique d'investissement future

Source : Cynthia, Hong Kong Ethereum Community Hub

Invité : qinbaFrank — Investisseur sur les marchés américains et secondaires des cryptomonnaies, qui décompose depuis longtemps les logiques macroéconomiques, industrielles et actionnariales selon les principes fondamentaux

Le 8 juin 2026, lors d'un événement VIP organisé conjointement par Futu, SNZ、ETH HK Hub et Sharplink, l'investisseur chevronné qinbaFrank a présenté une intervention intitulée « Retour sur la vague de puissance de calcul IA et perspectives », retraçant systématiquement le parcours complet du marché de l'IA depuis 2023 : des trois grands débats sur la nécessité de la puissance de calcul, à la manière dont le红利 de pénétration détermine l'efficacité commerciale, jusqu'à la phase critique actuelle où la pénurie matérielle cède la place à la validation commerciale.

Il a également fourni un cadre pour évaluer le niveau de ce correctif — trois scénarios : suppression de la valorisation, suppression des résultats, suppression de la logique — et a expliqué pourquoi cette vague d'IA ressemble superficiellement à la bulle internet de 2000, mais en diffère fondamentalement.

Déclaration : Le contenu de cet article présente fidèlement les opinions partagées par les invités et ne constitue aucune recommandation d'investissement, aucune offre de vente de produit ni aucune promesse de rendement.

Pourquoi un avertissement de risque a-t-il été émis le 3 juin et une partie de la position a-t-elle été réduite ?

Depuis 2023, j’ai écrit plusieurs réflexions sur la macroéconomie et cette vague de marché liée à l’IA et aux ressources de calcul. En juin 2024, j’ai recommandé Palantir sur X, estimant qu’en tant que représentant de l’IA dans la défense et l’industrie militaire, il avait encore un potentiel de croissance de 3 à 5 fois. À l’époque, cette opinion suscitait de vives controverses sur le marché, mais en regardant en arrière, il a effectivement connu une performance très remarquable.

C’est la première fois que je fais ce type de partage en personne. Profitez de cette opportunité pour que je structurerais systématiquement mon cadre global sur cette vague d’IA : comment elle a évolué, où elle en est actuellement et vers où elle pourrait se diriger à l’avenir.

Mercredi dernier (3 juin), j’ai été interviewé en soirée par la communauté américaine 168X sur X, pendant plus de deux heures. L’idée centrale était : le marché est actuellement un peu « trop chaud » et a besoin d’un refroidissement et d’un ajustement appropriés. Les raisons spécifiques sont les suivantes :

Premièrement, le sentiment est trop saturé et le FOMO est excessif. La concentration des fonds dans les directions populaires a atteint une position extrême ; une hausse parabolique est difficile à maintenir, tandis que les commandes et les résultats n'ont pas encore été entièrement réalisés.
Deuxièmement, la campagne de présentation de SpaceX a déclenché des réajustements de portefeuille par les institutions. Pendant la campagne de présentation de SpaceX, de nombreuses institutions ont commencé à réduire leurs positions concernées et à réallouer leurs fonds à l'avance, plutôt que d'attendre le moment officiel de la cotation — cet effet de rotation et de retrait de fonds se manifeste souvent à l'avance.
Troisièmement, la situation géopolitique génère une aversion au risque. Les négociations entre les États-Unis et l'Iran restent imprévisibles, et en combinaison avec les données sur l'emploi non agricole publiées vendredi dernier et les données CPI de cette semaine, la propension au risque du marché a globalement diminué.
Quatrièmement, les données sur l'emploi non agricole affectent les attentes de baisse des taux. Si les données sur l'emploi non agricole de mai dépassent largement les attentes, le marché réévaluera les perspectives de taux plus élevés.
Cinquièmement, les données de l’IPC de cette semaine constituent le véritable facteur politique. Un solide rapport sur l’emploi ne suffit pas à déterminer une hausse des taux ; ce qui compte vraiment, c’est l’IPC sous-jacent — en particulier si la hausse des prix de l’énergie se transmet et se propage aux prix des services, ce qui constitue le facteur clé à surveiller étroitement au cours des deux prochaines semaines.

La ligne de démarcation clé pour évaluer le niveau de ce ajustement est la suivante : une simple absorption des liquidités et de la suroccupation ne conduit généralement qu'à un ajustement de faible ampleur ; des données sur l'inflation supérieures aux attentes pourraient faire passer l'ajustement à une échelle petite à moyenne ; seul un ralentissement marqué de la monétisation de l'IA ou des revenus du cloud signifierait un rééquilibrage complet du récit. Dans l'ensemble, je pense que le marché a besoin, à court terme, d'un certain temps pour absorber et attendre ; les secteurs précédemment surpeuplés pourraient entrer dans une phase de correction modérée à moyenne, jusqu'à l'apparition d'un prochain « signal macroéconomique » atténuant la pression.

Deuxième partie : Retour sur les « trois grands débats » du marché de l’IA au cours des trois dernières années

Pour comprendre la situation actuelle, il est nécessaire de retrace le parcours complet de cette vague de marché IA depuis 2023. Je pense que ce n'est pas une simple augmentation linéaire, mais une vague propulsée par des cycles répétés de « débat du marché — validation — nouveau débat ».

Premier débat (2023 H2) : Les dépenses en capital sont-elles vraiment nécessaires ?

Au premier semestre 2023, cette tendance principale était principalement guidée par la valorisation — les résultats n'avaient pas encore montré d'amélioration significative, mais les cours avaient déjà augmenté (environ multipliés par plusieurs fois). À cette époque, le secteur mondial des semi-conducteurs était en phase de récession, et le marché restait largement divisé sur la question de la quantité de puissance de calcul nécessaire à l'IA ; par conséquent, l'ensemble du second semestre 2023 s'est caractérisé par une oscillation à des niveaux élevés.

Deuxième débat (début 2024 à début 2025) : les dépenses en capital des grandes entreprises continueront-elles à s'accélérer ?

Au premier trimestre 2024, les résultats d'NVIDIA ont commencé à s'améliorer环比, et les dépenses en capital des grandes entreprises technologiques ont également accéléré, ce qui a progressivement confirmé sur le marché que « la demande en puissance de calcul est une tendance réelle ». Un événement emblématique : lors du Forum de Davos au début de 2024, Sam Altman d'OpenAI a déclaré qu'il faudrait investir des dizaines de milliards de dollars dans la capacité de fabrication de puces. À l'époque, cette affirmation suscitait de grandes controverses dans l'industrie, les dirigeants d'NVIDIA et de TSMC ayant publiquement exprimé leur méfiance, estimant qu'un tel niveau d'investissement n'était pas nécessaire. Toutefois, compte tenu des dépenses en capital continues et supérieures aux attentes des grands fournisseurs de cloud par la suite, le marché a progressivement accepté cette hypothèse — la quantité d'électricité et de puissance de calcul requise pour les nouveaux centres de données aux États-Unis est effectivement de l'ordre de plusieurs milliers de milliards de dollars.

À cette étape, les fonds ont été transférés des dépenses en capital des grandes entreprises technologiques vers NVIDIA et sa chaîne d'approvisionnement en amont, stimulant le mouvement haussier principal de 2024.

Troisième débat (début 2025) : La puissance de calcul est-elle surévaluée ?

Au premier trimestre 2025, un grand modèle ayant considérablement amélioré son efficacité d'entraînement a été lancé, suscitant des doutes sur le besoin réel d'autant de puissance de calcul, ce qui a entraîné un recul notable des cours. En février, les changements dans la politique tarifaire américaine ont provoqué une nouvelle baisse, les actifs clés concernés ayant reculé de manière significative depuis leur pic — il s'agit du deuxième ajustement majeur de cette vague de marché.

Phase 3 (second half of 2025) : Formation du consensus

D'ici au deuxième et troisième trimestre 2025, le marché ressentira une amélioration notable des capacités et de l'utilité des grands modèles, avec un passage des applications principalement axées sur l'entraînement à celles centrées sur l'inférence. L'augmentation de la taille des paramètres des modèles et de leurs capacités multimodales stimule davantage la demande en puissance de calcul. À cette étape, les dépenses en capital des grandes entreprises technologiques entrent dans une nouvelle phase d'accélération, entraînant une nouvelle vague de hausse du marché.

Troisième : Cadre central : Le taux de pénétration détermine l'efficacité de la commercialisation

Je juge personnellement la portée d'une vague technologique en me basant sur son taux de pénétration, et non simplement sur l'existence d'une tendance.

Beaucoup de gens comparent cette vague de marché IA à la bulle internet de 2000. Je pense qu'ils sont "semblables en apparence, mais différents en fond" : tous deux ont connu une hausse parabolique des valorisations avant les résultats, mais l'environnement industriel est radicalement différent.

Aux alentours de l'an 2000, le taux de pénétration d'Internet aux États-Unis était à peine supérieur à 30 %, et les modèles économiques (publicité, commerce électronique, jeux, services supplémentaires) étaient encore en phase d'expérimentation ; c'est pourquoi, après l'éclatement de la bulle, l'indice Nasdaq a mis un temps considérable à se redresser.
L’Internet mobile autour de 2010 était différent : après le lancement de l’iPhone en 2007 et l’ouverture du système Android, la pénétration de l’Internet mobile en Chine et aux États-Unis a accompli la transition de la phase initiale à la phase dominante en environ dix ans (2010-2018) — bien plus rapidement que les vingt à trente ans nécessaires à l’Internet. Cela s’explique par le fait que les infrastructures de la génération précédente (la généralisation de l’Internet et l’efficacité de la diffusion de l’information) avaient posé une excellente base pour la génération suivante.

Aujourd'hui, nous faisons face à un environnement dans lequel des milliards de personnes à travers le monde utilisent déjà WeChat, les médias sociaux et diverses applications — la vitesse de propagation de l'information et l'acceptation des nouvelles technologies par le grand public sont totalement différentes de celles de l'année 2000. C'est précisément la principale différence entre cet écosystème d'IA et celui d'Internet en 2000.

En ce qui concerne la méthode d'analyse, je souscris à un point clé du « cycle d'adoption technologique » (théorie de la faille) : un taux de pénétration de 10 % constitue un seuil critique. En dessous de 10 %, la technologie se trouve encore en phase de « validation précoce », et son caractère révolutionnaire détermine sa capacité à prendre de l'ampleur. Une fois franchi ce seuil de 10 %, cela signifie que la technologie a dépassé le marché de masse, et sa courbe de croissance s'accentue généralement. La fourchette comprise entre 10 % et 50 % constitue la fenêtre d'observation essentielle, ainsi que la « période dorée » pour les investissements dans l'industrie associée — la croissance de la base d'utilisateurs et l'augmentation de la volonté de payer se produisent simultanément, entraînant une hausse de la consommation de jetons. Au-delà de 50 %, l'espace de croissance diminue progressivement.

Selon une étude : selon une enquête d'un grand institut bancaire sur la volonté des entreprises d'acheter de l'IA, ce pourcentage est passé d'environ 10 % en septembre de l'année dernière à environ 18 % fin mars de cette année — ce qui signifie que la pénétration de l'IA dans les entreprises a franchi le point critique et entre officiellement dans une période de croissance rapide.

Si l'on compare cette vague d'IA aux trois vagues technologiques précédentes : l'Internet PC a mis environ 20 ans, de 1990 à 2010, pour atteindre une pénétration complète ; l'Internet mobile a mis moins de 10 ans, de 2010 à 2019 ; tandis que l'IA, à partir de 2023, pourrait avoir une diffusion encore plus rapide. La raison fondamentale réside dans le fait que plus les infrastructures sont complètes, plus le cycle de commercialisation est court — à l'ère de l'Internet mobile, les smartphones, la 4G, les applications et les paiements mobiles ont favorisé la massification ; aujourd'hui, l'IA repose sur des infrastructures telles que la puissance de calcul cloud, les API de modèles, la propagation sociale et les agents, ce qui rend la diffusion de l'information et les méthodes de commercialisation bien plus matures que lors des générations précédentes.

Quatrième : IA et Internet : différences fondamentales dans les logiques de commercialisation

Le problème central résolu par Internet est « l'efficacité de la connexion et de la diffusion de l'information » — il réduit les coûts des intermédiaires dans les flux d'information, de marchandises et de fonds, mais ne remplace pas directement « l'humain ».

L’IA est différente : elle remplace directement la cognition et le travail humains. Lorsque la capacité d’une IA atteint ou dépasse le niveau moyen de la main-d’œuvre humaine, elle ne se limite pas à améliorer l’efficacité, mais constitue une substitution réelle — ce qui signifie que les entreprises paient l’IA, en essence, le même coût qu’elles payaient auparavant pour employer cette main-d’œuvre. C’est pourquoi de nombreuses personnes (y compris moi-même) augmentent rapidement leur dépense pour les outils d’IA, passant de la version gratuite à des abonnements mensuels de plusieurs dizaines ou centaines de dollars, voire en payant simultanément plusieurs grands modèles — dès lors qu’elles constatent que « cela fait mieux et plus vite que moi », leur volonté de payer augmente de manière très déterminée. Ainsi, dès que l’IA dépasse le niveau intellectuel moyen de la société, sa valeur commerciale augmente de façon exponentielle.

Cela répond également à une question soulevée précédemment par les invités : dans la tendance à la substitution rapide des tâches cognitives par l'IA, comment la valeur de la "barrière compétitive" constituée par les connaissances et l'expérience professionnelles individuelles va-t-elle évoluer ? C'est l'une des raisons fondamentales pour lesquelles la commercialisation de l'IA est plus complexe que celle d'Internet.

Cinq : Logique d'investissement dans la chaîne de valeur de la puissance de calcul : du récit unique sur les GPU à une réévaluation systémique

La logique de cet cycle d'investissement dans la puissance de calcul s'étend désormais au-delà du simple pari sur les GPU, pour inclure une réévaluation systémique de l'ensemble de la chaîne : stockage, CPU, interconnexion, alimentation, emballage et matériel périphérique. L'ensemble peut être résumé selon un cadre en trois étapes : à court terme, "pénurie de ressources" ; à moyen terme, "mise à niveau du système" ; à long terme, "taux d'adoption de l'IA physique".

1. Prix en pénurie : La demande de GPU se répercute sur le stockage et le CPU

La chaîne logique est la suivante : les contextes longs, le multimodal et les applications Agent augmentent la demande de stockage — le HBM est le premier à faire face à une tension, puis cette pression se propage progressivement vers le DRAM/GDDR, le NAND/SSD/HDD, et enfin atteint les mécanismes d'ordonnancement du CPU, puis l'approvisionnement électrique.

D'abord, une pénurie de GPU. De 2022 à 2023, l'industrie mondiale du stockage était en cycle baissier, ce qui a entraîné un important nettoyage des capacités. En 2024, avec l'accélération des dépenses en capital des grands fournisseurs de cloud, les effets de ce nettoyage des capacités commencent à se faire sentir.

Ensuite, il y a une pénurie de mémoire / HBM. La production HBM elle-même est complexe et le taux de rendement s'améliore lentement. Après la précédente vague de surcapacité sévère, les principaux fabricants de mémoire sont très prudents quant à l'expansion de leur capacité ; les nouvelles capacités ne seront progressivement mises en service qu'à partir du second semestre 2027. Cela a considérablement renforcé la capacité de négociation des fabricants de mémoire lors de la signature d'accords d'approvisionnement à long terme — des contrats d'une durée de cinq ans, exigeant des acomptes de 10 % à 30 %, voire demandant aux clients en aval de fournir des instruments de garantie financière. C'est pourquoi ces entreprises présentent un profil caractéristique de « performances avant valorisation » : leurs résultats ont continué à dépasser les attentes au cours des derniers trimestres, mais leur valorisation a été étouffée par la crainte du marché de revivre les cycles passés du secteur semi-conducteur, jusqu'à ce que l'existence de ces accords à long terme convainque progressivement le marché que les fluctuations cycliques seront « atténuées », permettant ainsi une révision à la hausse de la valorisation.

Ensuite, il y a une pénurie de processeurs CPU, puis une pénurie d'électricité. La cause fondamentale est que de nombreuses tâches d'orchestration et de planification dans les centres de données ne sont pas adaptées au traitement par GPU et doivent dépendre du CPU. Par exemple, pour le rack NVIDIA NVL72, la configuration actuelle est d'environ 72 GPU pour 36 processeurs Vera, soit un ratio CPU : GPU d'environ 1:2 (les premières configurations étaient d'environ 1:8) ; le marché anticipe que ce ratio pourrait évoluer vers une proximité de 1:1, ce qui signifie que le rôle du CPU (qu'il s'agisse de processeurs Intel, AMD ou de puces ARM propriétaires) dans les infrastructures de calcul est en cours de réévaluation. Ce phénomène se répercute ensuite sur les problèmes de capacité électrique et réseau des centres de données.

2. Mise à niveau des tarifs : interconnexions optiques, alimentation et emballage avancé mis à niveau simultanément

La deuxième ligne directrice est la « logique de mise à niveau » — l'essentiel n'est pas « si ce module existe ou non », mais si l'efficacité de conversion, la consommation d'énergie, la densité d'alimentation et le taux de rendement du conditionnement peuvent encore s'améliorer.

Interconnexion optique : les modules optiques évoluent vers LPO/NPO/CPO. L'optique co-emballée (CPO) intègre plus étroitement les puces optiques et électriques, ce qui pourrait théoriquement réduire la consommation d'énergie, mais n'est pas encore produit à grande échelle. Certaines enquêtes sur le terrain indiquent que les grands fournisseurs de cloud n'adopteront probablement pas massivement la CPO avant 2027 — la principale préoccupation étant la fiabilité : en cas de défaillance, un module optique traditionnel peut être remplacé directement, tandis qu'une défaillance CPO implique un remplacement au niveau de la carte entière, avec des coûts et des cycles de validation associés ; les grands acteurs ont encore besoin de temps pour valider pleinement les taux de rendement et de défaillance.

Réseau d’alimentation : évolution de 48/54 V vers 800 V CCHB. Ce cheminement est très similaire à celui de l’industrie des véhicules électriques — les premiers véhicules électriques utilisaient généralement des architectures à basse tension, présentant une efficacité réduite ; par la suite, des fabricants tels que BYD et Huawei sont progressivement passés à des architectures à tension plus élevée, offrant une tension plus élevée, un courant plus faible et des pertes réduites. Le système d’alimentation des centres de données traverse une évolution similaire, stimulant ainsi la demande pour les composants de puissance (comme le carbure de silicium) et la chaîne de valeur associée à la gestion de l’énergie.

Emballage avancé : empilement 3D + substrats en verre/céramique. Cela suit la même trajectoire d'évolution que les puces de smartphones ces dernières années — lorsque les gains de performance issus uniquement de la réduction des nœuds technologiques deviennent de moins en moins efficaces, l'industrie se tourne vers des méthodes d'emballage plus avancées (telles que l'empilement 3D ou des substrats en verre ou céramique) pour dépasser les limites physiques, en utilisant de meilleurs matériaux et procédés d'emballage pour continuer à améliorer les performances globales.

3. Prix à terme : calcul en périphérie et Physical AI

La logique à long terme est que le calcul en périphérie et l'IA physique entrent dans une phase de validation d'application — du raisonnement sur appareil avec de petits modèles, aux robots et à la conduite autonome, puis à la production de masse à grande échelle et à la réduction des coûts, aboutissant finalement à une nouvelle courbe d'adoption. À court et moyen terme, les points de suivi clés sont le stockage, les CPU/ARM, l'interconnexion optique, les équipements électriques et le conditionnement avancé ; à long terme, il faut observer la courbe de production de masse des robots et de la conduite autonome.

Sixième ligne d'investissement : de la contrainte physique à l'OS AI vertical

Une fois la tension sur l'offre de puissance de calcul atténuée, le centre d'intérêt du marché suivra un chemin de transition : contraintes physiques (puissance de calcul / capacité insuffisante) → niveau de déploiement des entreprises (les entreprises peuvent-elles transformer l'IA en système de production) → OS AI vertical (maîtrise de l'entrée aux flux de travail industriels) → AI physique (pénétration dans le monde physique réel).

La nature de la couche de déploiement entreprise n'est pas simplement d'intégrer un chatbot, mais de réécrire les processus de travail de l'entreprise : identifier d'abord les flux de travail à haut volume, à fort coût en main-d'œuvre et à résultats vérifiables, puis intégrer les données privées de l'entreprise (impliquant RAG, gestion des autorisations, lignée des données, graphe de connaissances), permettre à l'Agent d'exécuter réellement des actions (appeler des API, des SaaS, finaliser les processus d'approbation et de rétroaction), et mesurer continuellement le taux d'achèvement des tâches, le taux d'adoption, les coûts et le ROI.

Ce qu'on appelle « OS IA verticale » peut être compris comme la couche intelligente de contrôle sectoriel — contrairement aux SaaS traditionnels où l'humain manipule le logiciel, l'OS IA consiste en une IA qui appelle des outils et fait avancer les processus, tandis que l'humain assure la supervision, l'approbation et la prise de décision ; il s'agit fondamentalement de la combinaison d'un System of Intelligence + Action + Governance. Les indicateurs clés pour évaluer les progrès à ce stade incluent : si la commercialisation continue d'accélérer (ARR du modèle, revenus cloud, nombre de clients entreprises), si la qualité du déploiement a véritablement franchi la ligne de production (taux d'achèvement des tâches, taux de reprise humaine, précision), si l'économie est bouclée (coût unitaire d'inférence, ROI, marge brute), ainsi que si un avantage concurrentiel s'est formé (données privées, profondeur des processus, audit de conformité).

Sept. : Ancre sous-jacente de la montée en vagues : modèle ARR et revenus cloud

La pérennité du récit de marché ne dépend pas tant de la « cherté de la valorisation » que de la capacité des fabricants de modèles à maintenir une croissance élevée de leur ARR (revenu récurrent annualisé) et de leurs revenus liés au cloud — ce qui détermine si les dépenses en capital des grandes entreprises technologiques sont justifiées et si la vitalité de toute la chaîne de calcul peut se poursuivre. Cette chaîne de transmission est la suivante : demande réelle (paiements réels provenant des utilisateurs B/C) → croissance élevée de l'ARR des fabricants de modèles → revenus cloud supérieurs aux attentes → bénéfices continus pour la chaîne de calcul.

Autour de cette chaîne de transmission, trois cas peuvent être examinés :

Scénario 1 : La croissance ne ralentit pas, la logique n'est pas inversée. Si les revenus récurrents annuels (ARR) des fabricants de modèles continuent d'augmenter et que les activités cloud dépassent toujours les attentes, cela signifie que la justification des dépenses en capital reste valide et que la logique des commandes dans la chaîne de calcul reste applicable. Dans ce cas, même si les prix ont fortement augmenté à court terme et que la valorisation est jugée « trop chère », entraînant un recul modéré à important, les fondamentaux ne se sont pas détériorés — les baisses sont souvent rapides, tout comme les reprises, qui peuvent être rapidement déclenchées par les résultats financiers ou l'apparition de nouvelles applications.

Scénario 2 : Croissance inférieure aux attentes, réinitialisation du récit. Si les résultats des fabricants de modèles sont nettement en baisse, ou si la chaîne de demande des services cloud montre un ralentissement clair, cela indique que le problème est plus proche du « point de départ de la commercialisation » — car de nombreuses acquisitions de puissance de calcul dans le cloud proviennent directement de ces fabricants de modèles. Dans ce cas, il s'agit au minimum d'un ajustement de niveau moyen, et il faut attendre de nouvelles preuves démontrant que la taille et la croissance pourront à nouveau dépasser les attentes pour que la confiance revienne.

Scénario 3 : Les facteurs macroéconomiques et de liquidité agissent comme des amplificateurs, mais ne sont pas la cause fondamentale. Les facteurs macroéconomiques et de liquidité influencent le sentiment du marché et le taux d'actualisation, mais ne deviennent un risque central que lorsqu'ils touchent réellement le volet commercial. Cela peut être divisé en trois niveaux : un simple retrait de liquidités ou un seul rapport CPI supérieur aux attentes correspond généralement à un ajustement de faible ampleur ; si cela s'ajoute à une inflation persistante, à l'absence de baisse des taux et à des risques géopolitiques, cela peut évoluer vers un niveau faible à modéré ; seul un ralentissement réel de l'ARR du modèle ou des revenus du cloud correspond à une réinitialisation logique de niveau modéré.

En bref : tant que les revenus ARR des grands modèles et les revenus cloud ne ralentissent pas, ce correctif ressemble davantage à une réévaluation des valorisations et de la liquidité qu’à un effondrement au style 2000 ; il faudra attendre des preuves concrètes de retournement une fois les fondamentaux réellement en déclin.

Huitième phase actuelle : du manque de matériel à la validation commerciale

De avril à juin de cette année, l'hypothèse centrale du marché était que les prévisions d'investissements en capital des grands fournisseurs de nuage continueraient de dépasser les attentes, soutenues par une demande réelle de paiement de la part des entreprises et des consommateurs pour les services cloud (c'est-à-dire la croissance des revenus du cloud). Si cette hypothèse est valide, cela signifie que les investissements en capital sont « raisonnables et durables », et que toute la chaîne d'approvisionnement — stockage, optique, CPU, puces, jusqu'à l'électricité et au réseau électrique — en tirera profit.

En regardant vers l'avenir, je pense que le centre d'intérêt du marché passera progressivement de la "pénurie de matériel" à la "réalisation commerciale". Un rapport publié en mai de cette année indiquait que, sur le marché des services aux entreprises, la catégorie de produits la plus vendue était en réalité l'implémentation et le conseil en IA — c'est-à-dire la capacité à aider les entreprises à intégrer réellement l'IA dans leurs processus opérationnels. Le raisonnement sous-jacent est le suivant : les procédés de production et les connaissances essentielles de nombreux secteurs ne sont pas des documents publics, mais sont plutôt ancrés dans l'expérience des employés expérimentés, et les données d'entraînement des grands modèles ne contiennent pas ces "connaissances implicites". Celui qui saura aider les entreprises à combiner ces savoir-faire sectoriels avec l'IA saisira les opportunités de la prochaine phase.

Mon jugement personnel est que tant que ce rythme de croissance ne s'aggrave pas de manière significative, les corrections futures, qu'elles soient dues à des facteurs macroéconomiques (comme les taux d'intérêt, les droits de douane, etc.), seront probablement des ajustements ponctuels de taille modérée, et non une inversion de tendance. Ce qu'il faut vraiment surveiller, c'est une baisse importante du rythme global de commercialisation de l'IA — ce n'est que là qu'il faudra réévaluer sérieusement la logique d'évaluation de tout le secteur.

Neuf : Référence historique : Cadre en trois niveaux pour le correctif du marché boursier américain

Évaluer le niveau du correctif du marché américain ne dépend pas seulement de l'ampleur de la baisse, mais surtout de savoir si la cause sous-jacente remet en question la logique à long terme — s'agit-il d'un simple coup de panique sur les valorisations, d'un choc lié à un événement macroéconomique, ou bien d'une réécriture complète du récit industriel. En utilisant le Nasdaq comme référence (car il est plus pur sur le plan technologique), les corrections des 20 dernières années peuvent être classées en trois niveaux :

Niveau L1 (baisse à un chiffre) : La cause typique est un ajustement de valorisation après une hausse trop rapide, combinée à un choc de liquidité ou à des incertitudes liées à l'inflation ou aux anticipations de baisse des taux. Ce type de correction n'est pas une crise ; les fondamentaux n'ont pas changé, et dès que les perturbations sont confirmées comme atténuées, le retournement se produit généralement rapidement. Un exemple récent est le recul d'environ 7 % à 8 % en novembre dernier, principalement dû à un choc de liquidité accompagné du début des doutes sur les investissements en capital dans l'IA.

Niveau L2 (environ 15 % de baisse) : Il est généralement accompagné d'événements macroéconomiques majeurs ou de chocs mécaniques sur le marché, ce qui nécessite une réévaluation des risques, mais ne signifie pas un effondrement de l'ordre fondamental ; le marché attend de nouvelles données pour confirmer que les risques ne se propagent pas davantage. Par exemple, le recul d'environ 15 % entre août et octobre 2023 s'est produit dans un contexte où le rendement des obligations d'État américaines à 10 ans approchait 5 % ; le recul de juillet-août 2024 est lié à la liquidation de trades de carry et aux inquiétudes du marché concernant une récession.

Niveau L3 (baisse de plus de 25 %) : signifie que les logiques macroéconomiques précédentes ont été réinitialisées ou que le récit à long terme du secteur a été remis en question ; la propension au risque subit une réévaluation systémique, et il faut de nouvelles preuves pour reconstruire la confiance. Des exemples historiques incluent la crise financière de 2008 (baisse de 50 %), le quatrième trimestre de 2018 (environ 25 % à 30 %), le choc de la pandémie en mars 2020 (environ 30 % à 40 %), le cycle de hausse des taux d'intérêt de 2022 (environ 33 % à 35 %), ainsi qu'un recul d'environ 28 % dû à des tensions tarifaires ou à un choc sur l'ordre commercial mondial.

Appliqué à la présente vague de marché IA, la ligne de démarcation fondamentale reste toujours la vitesse de croissance de la commercialisation de l’IA : si les revenus récurrents annuels des modèles, le nombre d’utilisateurs entreprises, les revenus en token et les revenus des activités cloud restent au-dessus des attentes, cela signifie que la logique commerciale n’a pas été inversée, et le recul est davantage dû à des ajustements de niveau faible à modéré causés par des facteurs de liquidité ou des perturbations macroéconomiques ; si les résultats des fabricants de modèles sont inférieurs aux attentes, cela signifie que l’on se rapproche déjà du point de départ de la commercialisation, et qu’une réévaluation de niveau modéré est au moins nécessaire, en attendant de nouveaux éléments ; seule une décélération de la croissance de l’IA, combinée à des risques systémiques tels qu’une inflation explosive, des conflits géopolitiques ou une rupture de l’ordre mondial, pourrait déclencher un ajustement de niveau majeur.

En bref : tant que la commercialisation de l'IA ne ralentit pas, ce correctif ressemble davantage à une "réévaluation" ; ce n'est que lorsque les preuves de commercialisation se tarissent que le cadre entier doit être réinitialisé.

Dix : Résumé : L'IA constitue un saut fondamental des capacités de base de la civilisation

Enfin, partagez ma compréhension personnelle de la nature de cette vague. La poudre à canon, la machine à vapeur, l'électricité et Internet de l'histoire sont, en essence, des « révolutions industrielles ponctuelles » — elles améliorent un outil, une énergie ou un canal d'information spécifique, résolvent un goulot d'étranglement clé, puis se propagent le long de la chaîne de valeur, présentant une courbe en S caractéristique d'un cycle technologique unique. Ces révolutions modifient une « capacité unidimensionnelle », et non pas directement l'intelligence elle-même.

Je pense que l'IA est différente — elle améliore la capacité fondamentale la plus basique : l'« intelligence ». On peut faire une analogie avec l'usage du feu par les humains : passer de ne pas savoir utiliser le feu à savoir l'utiliser ne se limite pas à « acquérir un nouvel outil » ; la cuisson des aliments a modifié la structure corporelle, influençant ainsi la capacité cérébrale, et a finalement conduit à une expansion des capacités civiles entières. L'IA modifie de la même manière les capacités fondamentales — la perception, le raisonnement, la génération, la prise de décision, l'action — ensemble, ces capacités sont globalement déplacées vers le haut ; il s'agit d'une mise à niveau fondamentale au niveau de la « fonction de production civile », et non simplement d'améliorer un outil spécifique.

En raison d'un saut dans les capacités fondamentales, de nouvelles révolutions industrielles émergeront de manière continue et progressive : la révolution des agents, la révolution des robots, la révolution des drones, puis la restructuration des processus dans la défense, l'industrie militaire, les technologies spatiales et bien d'autres secteurs. Ce processus ne se produira pas en une seule fois, mais par vagues successives. Je pense donc que la ligne directrice véritablement à suivre n'est pas de parier sur une application spécifique, mais d'observer en continu « comment les capacités intelligentes se propagent vers le monde physique et les processus industriels » — c'est là la piste essentielle pour évaluer jusqu'où cette vague d'IA pourra aller.

Sur les un à deux prochaines années, je pense que les gens continueront de ressentir cette « accélération de l'accélération » — où les capacités technologiques et le processus de commercialisation se valident et se stimulent mutuellement. Toutefois, le marché ne suivra certainement pas une ligne droite, mais affichera une caractéristique ondulatoire, passant constamment d'une logique de « pénurie → mise à niveau → réalisation à long terme ».