Guerre IA : Les trois couches de calcul, de modèles et de contrôle des flux de travail

iconMetaEra
Partager
AI summary iconRésumé
Cette compétition s’est finalement concentrée sur la lutte pour le contrôle de trois domaines : la couche de calcul (course aux armements en CAPEX, 805 milliards de dollars par an), la couche de modèles (compétition R&D entre Anthropic/OpenAI/Google) et la couche de flux de travail (bataille pour les points d’entrée : Cursor/Copilot/SaaS entreprise). Le véritable avantage concurrentiel ne se forme que dans cette dernière couche — celui qui contrôle les flux de travail contrôle la roue des données et acquiert un avantage structurel lors des prochaines itérations de modèles. Le prix d’acquisition de Cursor à 60 milliards de dollars constitue essentiellement le dernier point d’ancrage du marché pour la valorisation du « contrôle des flux de travail », et ce prix continue d’augmenter.

Auteur de l'article, source : SkillsMaster

Introduction : Trois champs de bataille et une proposition centrale

En 2026, la plus grande concentration de capital de l'histoire de l'humanité est en cours. Les six géants technologiques américains investiront ensemble 805 milliards de dollars (environ 5,8 billions de yuans) dans l'infrastructure de l'IA cette année — un montant supérieur au PIB annuel de la plupart des pays et plus du double des dépenses de défense américaines pour l'ensemble de l'année 2023.

Dans le même temps, SpaceX a acquis Cursor (un outil de programmation IA qui n'était évalué qu'à 59 millions de dollars il y a trois ans) via une transaction entièrement en actions d'une valeur de 600 milliards de dollars, conclue le quatrième jour suivant l'IPO de SpaceX, provoquant une hausse de 17 % en une journée pour SPCX et une capitalisation boursière temporairement supérieure à celle de Microsoft. Le chiffre d'affaires annuel d'Anthropic a bondi de 10 milliards de dollars à 470 milliards de dollars en 16 mois, bien que l'entreprise n'ait jamais réalisé de bénéfice trimestriel, et sa valorisation approche désormais 965 milliards de dollars.

Ces événements sont des fronts différents d’une même guerre. Cet article décompose cette guerre en trois champs de bataille distincts mais interdépendants : la course aux investissements en capital (CAPEX) au niveau de la couche calcul, la compétition en recherche et développement au niveau du modèle, et la lutte pour les points d’entrée au niveau de la couche flux de travail. L’argument central est que la force des avantages concurrentiels varie considérablement entre ces trois couches, et que la plupart des acteurs du marché portent leur attention au mauvais niveau.

Chapitre 1 : Couche de puissance de calcul : la course aux armements de 805 milliards de dollars de CAPEX

La couche de puissance de calcul est la base matérielle de cette guerre et la barrière d'entrée. En 2023, les six grands acteurs américains (Amazon AWS, Google Alphabet, Microsoft Azure, Meta, Oracle Cloud, CoreWeave) ont cumulé des dépenses en capital de 146 milliards de dollars ; la prévision pour 2026 est de 805 milliards de dollars, soit une augmentation de 451 % en trois ans.

1.1 Économie du token : chaque token est une unité de profit

Jensen Huang a présenté la logique économique fondamentale des usines d'IA lors du GTC Taipei 2026 : la puissance de calcul équivaut aux revenus, car chaque Token est une recette, chaque Token est un profit. Cette logique transforme les dépenses en capital (CAPEX) d'"coût" en "investissement en capacité de production" — comme une usine qui construit davantage de lignes de production. Les dépenses en capital pour une usine d'IA de 1 GW atteignent déjà 50 à 80 milliards de dollars ; le système de rack NVIDIA Vera Rubin NVL72 réduit les coûts d'inférence de dix fois par rapport à Blackwell, renforçant davantage ce modèle économique.

1.2 Compression de capital : que signifie un taux de réinvestissement de 128 % ?

En 2023, les dépenses en immobilisations de ces six entreprises représentaient uniquement 40 % de leur flux de trésorerie d'exploitation, une grande partie de la trésorerie étant utilisée pour des rachats d'actions et des dividendes. En 2026, ce ratio a dépassé 100 %, signifiant que les flux de trésorerie d'exploitation ne suffisent plus à couvrir les dépenses d'infrastructure, obligeant les entreprises à recourir au financement externe. Le financement par actions d'Alphabet à hauteur de 84,75 milliards de dollars (juin 2026) — utilisant une structure de capital à plusieurs niveaux (actions privilégiées convertibles à 40 milliards de dollars + obligations zéro coupon à 10 milliards de dollars + actions ordinaires et privilégiées à 34,75 milliards de dollars) — est directement issu de cette pression et constitue le plus grand financement par actions unique de l'histoire.

La barrière de la puissance de calcul est réelle, mais elle constitue un seuil d'entrée, pas un avantage différenciant. Posséder de la puissance de calcul ne donne qu'une « autorisation de participer » sans garantir la victoire finale.

1.3 Paradoxe stratégique de la couche de puissance de calcul : NVIDIA 2026 YTD -18,9 %

Les données de prix des actions M7 (au 18 juin 2026) révèlent une contradiction structurelle : NVIDIA est le bénéficiaire le plus direct de la course aux investissements en capital, mais ses actions ont chuté de 18,9 % depuis le début de l'année 2026, la plus forte baisse parmi les M7. Le marché intègre un risque à long terme — une grande partie des investissements en capital des acheteurs en aval est destinée à développer des chemins d'ASIC propriétaires contournant NVIDIA (AWS Trainium, Google TPU v7, Microsoft Maia). La performance de CoreWeave (+240 %) et de Micron (+259 %) depuis le début de l'année 2026 reflète la perception des marchés financiers sur les bénéficiaires du segment intermédiaire de la chaîne d'approvisionnement en IA.

Chapitre 2 : Couche modèle : Concurrence en R&D et « l'illusion du fossé compétitif »

Si la couche de puissance de calcul détermine qui a le droit de participer, et la couche de modèle détermine qui prend les devants au début de la compétition — les données de Sensor Tower ont déjà prouvé que l'avantage de la couche de modèle ne peut pas être transformé en une fidélisation durable des utilisateurs.

2.1 Part de ChatGPT divisée par deux : la reconnaissance de la marque ne signifie pas une fidélisation des utilisateurs

La part mondiale de ChatGPT est passée de près de 85 % en mai 2023 à environ 43 % en mai 2026, une baisse de plus de 40 points de pourcentage, sans aucun rebond au cours de cette période. Cette courbe transmet un signal fondamental : l'effet de réseau des LLM grand public est extrêmement faible. Les utilisateurs basent leur choix sur l'utilité immédiate ; il n'existe aucune verrouillage social du type « mes amis sont là, donc je suis là », ni aucune bibliothèque de contenu accumulée sur plusieurs années (comme la bibliothèque de films de Netflix).

En janvier 2025, le lancement de DeepSeek a provoqué la plus forte variation unitaire de part de marché de toute la série temporelle — ChatGPT a perdu environ 10 points de part de marché en quelques semaines. Cela démontre qu'une alternative open source, gratuite et de performance équivalente suffit à redistribuer des dizaines de millions d'utilisateurs en un temps extrêmement court. Le coût de basculement pour les utilisateurs finaux des LLM est en réalité proche de zéro.

2.2 Le paradoxe d'Anthropic : une entreprise évaluée à 1 000 milliards de dollars et en perte

Anthropic n'a jamais réalisé de bénéfice trimestriel depuis sa création en 2021, ayant brûlé 56 milliards de dollars en cash en 2024 (marge brute de -94 %), tout en atteignant une évaluation de 965 milliards de dollars en milieu d'année 2026 (Série H). Le chiffre d'affaires annuelisé est passé de 10 milliards de dollars en janvier 2025 à 470 milliards de dollars en mai 2026 — une croissance de 47 fois en 16 mois.

Le cœur de cette logique d'évaluation ne réside pas dans les bénéfices actuels, mais dans le verrouillage double créé par l'intégration API côté entreprise : 80 % des revenus proviennent de clients professionnels, et les bibliothèques de code, les systèmes de conformité et les processus produits de plus de 300 000 clients commerciaux sont profondément intégrés à l'API Claude. Le coût de changement n'est plus une question de « quel modèle est le meilleur », mais de « coûts d'ingénierie pour restructurer l'intégration entière » — un coût qui dépasse souvent la différence de performance entre les modèles.

Le avantage concurrentiel au niveau du modèle est éphémère — chaque nouvelle version de modèle, publiée tous les 6 à 12 mois, peut effacer tout avantage en termes de performance. Ce qui crée réellement un verrouillage, ce sont les flux de travail et l'intégration des données construits autour du modèle.

Chapitre 3 : La couche de flux de travail : la bataille pour l'accès aux SaaS entre Cursor, Copilot et les entreprises

La couche de flux de travail est celle qui possède le fossé le plus profond et la plus longue durée de vie parmi les trois domaines de combat. Intégrer un flux de travail signifie entrer dans l'environnement où les utilisateurs travaillent huit heures par jour — une fois les habitudes établies, les données accumulées et les processus intégrés, le coût de remplacement passe de « le modèle est-il facile à utiliser » à « la reconstruction de l'ensemble du système de travail ».

3.1 Cas Cursor : Expérience aux limites de la viscosité des flux de travail

Analyse de cas approfondie | SpaceX acquiert Cursor pour 60 milliards de dollars : de 59 millions de dollars en seed à l'acquisition la plus chère d'un outil IA de l'histoire

Cursor a été créé en 2023 par quatre étudiants en licence du MIT à partir d'une fork de VS Code, révolutionnant le paradigme d'interaction entre les développeurs et le code grâce à un flux de travail appelé « Vibe Coding » — les développeurs n'ont plus besoin de gérer la syntaxe de bas niveau, mais effectuent une orchestration AI de haut niveau assistée par l'IA. À son apogée, Cursor représentait 41 % du marché des outils de programmation IA et contribuait à environ la moitié des revenus de l'API Anthropic Claude.

3.2 Tension mortelle entre la viscosité du flux de travail et la dépendance au modèle

La leçon la plus importante de l’exemple de Cursor ne réside pas dans son succès, mais dans sa vulnérabilité structurelle. Après qu’Anthropic ait coupé l’accès à Claude en 2026, la part de marché de Cursor dans la programmation AI est passée de 41 % à 26 %. Cet événement révèle clairement que la fidélité des flux de travail au niveau application repose sur la stabilité de l’offre au niveau modèle ; dès que le fournisseur sous-jacent reprend le contrôle, même la plus forte fidélité des flux de travail s’effondre instantanément.

SpaceX est acquis pour 60 milliards de dollars via une transaction entièrement en actions, ce qui permet de résoudre fondamentalement ce risque d'offre en interne la fourniture de modèles grâce à l'intégration du modèle Grok de xAI et du supercalculateur Colossus de Memphis (l'un des plus grands clusters GPU au monde), tout en conservant les données massives de décisions de code réelles accumulées par Cursor. La génération de code est le scénario d'application à la plus haute valeur des LLM ; ces données possèdent une valeur inestimable pour l'amélioration continue des modèles xAI. 2

3.3 Microsoft Copilot : avantages systémiques des canaux de distribution

La stratégie de flux de travail de Microsoft suit un chemin totalement différent de celui de SpaceX/Cursor. Copilot ne repose pas sur une croissance naturelle pilotée par l'expérience produit, mais sur une pénétration forcée grâce aux 345 millions d'abonnés payants de Microsoft 365. Le chiffre d'affaires annuel de GitHub Copilot dépasse déjà 2 milliards de dollars (2026), avec un taux de renouvellement entreprise supérieur à 85 %.

Plus important encore, l'avantage de Microsoft en matière de données : les flux de travail professionnels accumulés via des produits comme Office, Teams et Outlook créent une capacité de compréhension contextuelle que tout outil IA indépendant peine à reproduire. Lorsque Copilot peut citer les comptes rendus de réunion Teams d'hier directement dans un document Word tout en liant les chaînes d'e-mails pertinentes dans Outlook, le coût de changement passe de simple « remplacement logiciel » à une « rupture de la mémoire de travail ».

3.4 Couche SaaS entreprise : Salesforce, Workday et entrées AI verticales

La concurrence au niveau des flux de travail ne se limite pas aux outils IA généraux. Les éditeurs traditionnels de logiciels SaaS intègrent les capacités des LLM dans leurs produits principaux, créant ainsi un contrôle verticalisé des flux de travail IA. La capacité de Salesforce Einstein GPT à accéder directement aux données CRM lui confère une bien plus grande adhérence dans les flux de vente que n’importe quelle interface LLM générale. L’intégration de Workday AI dans les processus de prise de décision RH génère également un coût de migration de données et de processus extrêmement élevé.

Cas historique parallèle | WhatsApp (22 milliards de dollars) → Cursor (60 milliards de dollars) : Évolution du paradigme des acquisitions fondées sur les effets de réseau

En 2014, Facebook a acquis WhatsApp pour 22 milliards de dollars (dont 19 milliards de dollars = 4 milliards de dollars en espèces + 15 milliards de dollars en actions) ; à l'époque, WhatsApp enregistrait une perte nette de 138 millions de dollars en 2013 et un revenu quasi nul. Logique de fusion-acquisition : la création d'un réseau social basé sur les carnets d'adresses des utilisateurs génère un verrouillage horizontal, où chaque nouvel utilisateur augmente la valeur de l'ensemble du réseau (effet de réseau bilatéral classique) ; le motif défensif de Facebook était d'empêcher les concurrents d'accéder au point d'entrée des messages mobiles.

La structure logique de Cursor est similaire mais plus complexe : ses effets de réseau horizontaux sont plus faibles que ceux de WhatsApp (les développeurs ne sont pas contraints d'utiliser Cursor parce que leurs collègues l'utilisent), mais son moteur de données vertical est bien plus puissant que celui de WhatsApp (les données réelles sur les décisions de code améliorent continuellement le modèle, créant une boucle auto-renforçante : flux de travail → données → modèle → meilleur flux de travail). Les 60 milliards de dollars représentent la valorisation du marché pour la combinaison « contrôle du flux de travail + moteur de données sur le code », soit une prime d'environ 172 % par rapport à WhatsApp, reflétant une réévaluation des valeurs des flux de travail à l'ère des LLM.

Chapitre 4 : La guerre de l'AI Factory : emplacement, construction et conditions d'inefficacité du fossé compétitif

L'analyse des trois fronts montre que le fossé compétitif n'est pas unique. Différents acteurs ont établi des barrières de force variable à différents niveaux, mais la question cruciale est la suivante : quel type de fossé compétitif peut survivre aux cycles d'itération technologique ? Dans quelles conditions un tel fossé deviendra-t-il obsolète ?

4.1 Rempart de puissance de calcul : réel mais non différenciant

Posséder de grands clusters GPU crée un seuil d'entrée, mais ne permet pas de créer un avantage différenciant — car les concurrents peuvent acheter les mêmes matériels avec le même capital. La plateforme Vera Rubin de NVIDIA réduit les coûts d'inférence de 10 fois, ce qui signifie que la baisse rapide des coûts de calcul affaiblira davantage la valeur du « plus de calcul » comme avantages concurrentiels. La condition d'effondrement de l'avantage concurrentiel au niveau du calcul : la maturité à grande échelle des ASIC internes (prévue pour 2027-2028), à ce moment-là, l'avantage coûts des grands fournisseurs de cloud pour l'inférence sera fortement réduit.

4.2 La tranchée du cycle de données : l'avantage à long terme le plus difficile à copier

Les données réelles de décisions de codage de développeurs collectées par Cursor, les données commerciales propriétaires accumulées à partir des appels d'API d'Anthropic, ainsi que les données de flux de travail d'entreprise issues d'Office 365 de Microsoft, constituent les actifs les plus défensibles de l'ère de l'IA. La profondeur du fossé créé par la roue de données dépend de deux variables : la propriété des données (si elles peuvent être copiées ou remplacées par synthèse) et le degré de couplage entre les données et l'amélioration du modèle (si les données conduisent réellement à des capacités différenciantes du modèle).

4.3 Contrôle du flux de travail : le dernier rempart

Le contrôle du flux de travail est la barrière la plus durable parmi les trois. Sa logique de défense ne repose pas sur un avantage continu en performance du modèle (il est possible de changer de fournisseur au niveau du modèle), mais sur les coûts de friction liés à la migration — réécrire les invites, reconstruire les intégrations API, former à nouveau les employés, et repasser les audits de sécurité et de conformité. La somme de ces coûts dépasse souvent les gains d'efficacité apportés par un nouveau modèle, créant ainsi un verrouillage inertiel durable.

Trois conditions d’expiration : ① Apparition d’un nouveau paradigme de workflow révolutionnaire (par exemple, passage de « la programmation assistée par l’IA » à « la programmation entièrement autonome par l’IA », réinitialisant toute la logique du workflow) ; ② Ouverture d’interfaces standardisées éliminant les coûts de migration (par exemple, un protocole unifié d’appel d’agents IA) ; ③ Exigence réglementaire imposant la portabilité des données.

4.4 Géopolitique : un risque systémique sous-estimé

Les trois niveaux de fossé protecteur reposent tous sur une hypothèse implicite : une chaîne d'approvisionnement stable. Les sept puces co-conçues de la plateforme NVIDIA Vera Rubin sont toutes fabriquées selon le procédé 3 nm de TSMC, et la mémoire HBM4 provient de trois fabricants coréens. Le risque géopolitique à Taïwan et les contrôles à l'exportation peuvent interrompre la chaîne d'approvisionnement en matériel à tout moment, et ce risque n'est pas suffisamment pris en compte dans les plans actuels de CAPEX. Il s'agit du seul véritable risque systémique exogène dans la guerre de l'AI Factory.

Conclusion : Qui gagnera cette guerre ?

La thèse centrale de cet article a été systématiquement vérifiée après l'analyse des données des trois chapitres : les barrières à l'entrée dans la concurrence de l'IA ne se situent pas au même niveau ; la couche de puissance de calcul détermine l'éligibilité à la survie, l'avance à la couche modèle est éphémère, et seuls les acteurs qui contrôlent la couche de flux de travail peuvent établir un pouvoir de tarification durable.

Les données de Sensor Tower ont démontré une absence de fidélité côté consommateur ; le fait que la part de ChatGPT ait été divisée par deux en trois ans constitue la preuve la plus claire. L'acquisition de Cursor à 60 milliards de dollars indique que le marché a déjà réévalué le contrôle des flux de travail, et ce prix continuera d'augmenter. La présence simultanée d'un ARR de 47 milliards de dollars chez Anthropic et de pertes persistantes prouve que le verrouillage créé par l'intégration d'APIs entreprises suffit à justifier une valorisation bien supérieure à ses bénéfices actuels.

Du point de vue du paysage concurrentiel, Microsoft possède le plus équilibré des trois niveaux de fortifications : la puissance de calcul Azure, l'accès aux modèles OpenAI et les points d'entrée de flux de travail Office/GitHub ; Anthropic mène en termes de fidélité API entreprise, mais fait face à une pression continue liée à la consommation de capitaux ; l'avantage de distribution de Google (Android + Search) est difficile à reproduire sur le segment grand public ; le modèle d'intégration verticale de SpaceX/xAI + Cursor est encore en phase de validation, mais en cas de succès, il construira la combinaison de fortifications la plus difficile à démanteler.

La guerre finale ne portera pas sur laquelle des modèles est le plus intelligent, mais sur laquelle des chaînes de travail est la plus difficile à quitter. C’est une logique commerciale validée depuis l’ère WhatsApp, amplifiée à une échelle de mille milliards de dollars à l’ère des LLM.

Source des données et notes

1 Équipe d'analystes de Bank of America (avril 2026) ; TrendForce Global Research (mai 2026) ; prévisions financières du Q1 2026 d'Amazon, Alphabet, Microsoft, Meta, Oracle. Graphique « U.S. AI Hyperscale CAPEX Sprint » ; graphique « Capital Squeeze : CAPEX vs. OCF ».

2 annonces de fusion-acquisition SpaceX/Anysphere (juin 2026) ; disclosure officielle du ARR de Cursor ; documents de conférence du professeur Chen Lin, école de commerce de HKU (juin 2026) ; base de données de financement Crunchbase.

Annonce de financement de la série H d'Anthropic (mai 2026, évaluation de 96,5 milliards de dollars) ; graphique de données du matériel pédagogique de la HKU Business School « 1 billion de dollars de pertes pour une entreprise » ; Bloomberg Terminal.

4 NVIDIA GTC Taipei 2026, discours de Jensen Huang (1er juin 2026, Taipei Music Center) ; annonce du produit NVIDIA Vera Rubin ; SemiAnalysis « Vera Rubin : Extreme Co-Design » (février 2026).

5 Bloomberg Terminal ; graphique des données « M7 vs Micron 2026 YTD (18 juin 2026) » ; matériel pédagogique de la HKU Business School. Comptes annuels des entreprises sur plusieurs années.

6 Sensor Tower Global Research ; Prof. Chen Lin (林晨教授), HKU Business School, diapositives de la conférence « Customer Price Sensitivity and Loyalty » (juin 2026, données mondiales).

Résultats financiers de Microsoft pour l'exercice 2026 ; Divulgation officielle du ARR de GitHub Copilot ; Données sur les abonnés payants de Microsoft 365 (Q1 2026) ; Déclarations de Satya Nadella lors de la journée investisseurs.

Annonce d'acquisition de WhatsApp par Facebook/Meta (février 2014) ; données financières de WhatsApp pour 2013 ; matériel pédagogique de la HKU Business School « Old Story in the previous cycle » ; documents de la SEC.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.