Uber et Microsoft soulignent la hausse des coûts des jetons IA et le retour décroissant

Écrit par Bao Yilong

Source : Wall Street Journal

La justification des dépenses en IA des entreprises est mise à rude épreuve, la consommation de jetons continue d'augmenter, mais la valeur commerciale mesurable reste difficile à identifier.

Le 22 mai, Andrew Macdonald, directeur des opérations d'Uber, dont la capitalisation boursière dépasse 200 milliards de dollars, a déclaré sur un podcast que « il n'existe pas encore de lien » entre la croissance de la consommation de jetons et les améliorations réelles du produit.

Macdonald souligne que les entreprises ont de plus en plus de mal à justifier les dépenses continues en IA. Il a même inventé un terme spécifique pour décrire le gaspillage au sein des équipes d'ingénierie : « tokenmaxxing ».

Au début de mai, Microsoft a commencé à réduire les licences autorisées pour Claude Code au sein de l'entreprise, invoquant des factures Token « non durables ».

La combinaison de ces deux événements oblige le marché à prendre en compte une variable auparavant négligée. L'économie des jetons, c'est-à-dire l'économie unitaire de consommation de jetons à l'échelle de l'entreprise, est passée d'une question marginale à la colonne vertébrale centrale de tout le discours d'investissement dans l'IA.

Cinq jeux de données pour composer une nouvelle image

Depuis avril, plusieurs ensembles de données se sont succédé, dessinant ensemble un tableau alarmant.

En avril de cette année, le chef technologue d'Uber a déclaré publiquement que l'entreprise avait épuisé son budget annuel pour Claude Code en quatre mois.

Parmi les 5 000 ingénieurs, le taux d'utilisation mensuel varie entre 84 % et 95 %, avec une facture mensuelle par personne allant de 150 $ à 2 000 $ ; le CTO lui-même aurait consommé des jetons d'une valeur de 1 200 $ lors d'une démonstration interne de deux heures.

Macdonald a déclaré être « tellement choqué qu'il n'arrivait pas à parler » en apprenant ce chiffre.

Du côté de Microsoft, selon la newsletter Notepad de Tom Warren de The Verge, Claude Code a rapidement gagné en popularité parmi les ingénieurs internes de Microsoft, mais le modèle de facturation basé sur les tokens rend les dépenses à grande échelle insoutenables, poussant Microsoft à réduire les autorisations associées.

GitHub annonce qu'à partir du 1er juin, tous les plans Copilot passeront d'un abonnement forfaitaire à un modèle de facturation à l'utilisation.

Le message officiel a reçu près de 900 votes négatifs, car certains utilisateurs ont calculé qu'une seule session de programmation d'agent consomme généralement entre 30 et 40 dollars, ce qui signifie qu'un abonnement de 10 dollars par mois est épuisé après une seule utilisation.

La plateforme de productivité pour développeurs Entelligence.AI a regroupé les données de 2444 entreprises et a constaté que :

Pour chaque dollar dépensé en frais de token AI, seuls 18 cents ont généré une valeur réelle pour les utilisateurs.
44 cents pour corriger les bogues introduits par l’IA ; 27 cents vont vers les révisions ; 11 cents sont consommés par les frictions de revue.

Selon l'indice des dépenses en jetons Silicon Data LLM de Bloomberg, le prix des jetons a augmenté d'environ 65 % depuis la fin février de cette année, tandis que les prix des logiciels IA aux États-Unis ont augmenté de 20 % à 37 % au cours de la dernière année.

Bataille entre les négociants à la hausse et à la baisse : le même fait, deux interprétations

Les mêmes données conduisent à des conclusions totalement différentes selon les cadres d'analyse.

Les porteurs de vues haussières estiment que le désordre actuel n'est qu'une période de douleur lors d'une transition réussie.

Selon Jim Schneider de Goldman Sachs, dans son analyse début mai, les IA agents devraient faire croître la consommation de jetons de 24 fois d'ici 2030, atteignant environ 120 trillions de jetons par mois, et les marges brutes des fournisseurs de nuages à très grande échelle et des fournisseurs de modèles deviendront positives dans les 3 à 12 prochains mois.

Rich Privorotsky de Goldman Sachs estime que le premier trimestre 2026 pourrait être le sommet de l'utilisation du « token maximization » comme KPI, l'industrie passant progressivement d'une approche axée sur la consommation à une mesure plus saine : le coût unitaire d'action efficace.

L'étude économique de JPMorgan a également constaté une augmentation soudaine du nombre de nouveaux paquets et mises à jour Python sur PyPI au début de 2026, une tendance qui n'était pas présente lors du lancement de ChatGPT en 2022, ce qui indique que de véritables gains de productivité sont en cours.

De plus, le PER actuel du Mag 7 est d'environ 20 fois les bénéfices futurs, bien inférieur aux 52 fois au sommet de la bulle technologique de 2000, aux 67 fois au Japon en 1989 et aux 34 fois durant l'ère des « Beautiful Fifty ». Selon les critères historiques des bulles, la situation actuelle ne constitue pas une bulle.

Le point de vue vendeur a été le plus systématiquement exposé par l'analyste semi-conducteurs de Goldman Sachs, Jim Covello, dans un rapport d'avril.

Il a souligné que presque toute la valeur dans la chaîne d'approvisionnement de l'IA se dirige vers les entreprises de semi-conducteurs, un phénomène sans précédent dans l'histoire et insoutenable ; les fabricants de puces devraient bénéficier lorsque leurs clients prospèrent, mais durant ce cycle, leur prospérité s'est faite au détriment de l'ensemble de la chaîne d'approvisionnement en amont.

Le bénéfice net de NVIDIA a augmenté d'environ 20 fois depuis le lancement de ChatGPT ; les principaux fournisseurs de cloud à grande échelle ont épuisé leur flux de trésorerie opérationnel et passent désormais à l'endettement — les émissions de dettes liées aux centres de données devraient atteindre environ 182 milliards de dollars en 2025, soit le double de 2024.

L'étude de MIT Nanda montre que 95 % des entreprises ayant investi dans l'IA générative ont obtenu un retour nul. Ce décrochage pourrait durer un certain temps, mais ne peut pas durer indéfiniment.

Les préoccupations liées à la structure de financement cyclique

Cette discussion aborde également un niveau plus complexe : le cycle financier entre les fournisseurs de cloud à très grande échelle et les laboratoires d'IA.

Selon les documents de divulgation entreprise rassemblés par The Information, OpenAI et Anthropic représentent ensemble plus de la moitié des engagements futurs de 2 000 milliards de dollars auprès de Microsoft, Oracle, Google et Amazon pour des services cloud. Plus précisément :

Sur les 627 milliards de dollars de commandes en attente de services cloud de Microsoft, 280 milliards sont liés à OpenAI ;
Sur les 553 milliards de dollars de pipeline d'Oracle, 54 % (environ 300 milliards de dollars) sont promis par OpenAI ;
Sur les 467,6 milliards de dollars de Google, Anthropic représente 43 % (environ 200 milliards de dollars) ;
L'exposition correspondante d'Amazon atteint également 51 % de son arriéré de 464 milliards de dollars.

Cette structure de financement est intrinsèquement cyclique. L'investissement de Microsoft de 13 milliards de dollars dans OpenAI est principalement réalisé sous forme de crédits Azure, que OpenAI utilise pour acheter de la puissance de calcul Azure, que Microsoft inclut ensuite dans ses revenus cloud.

Le même fournisseur de services cloud à très grande échelle est à la fois investisseur dans les laboratoires d'IA et fournisseur de services facturant les ressources de calcul.

Cette structure se reflète également dans les données de rentabilité. Alphabet a annoncé un bénéfice record de 62,6 milliards de dollars pour le premier trimestre, dont environ 28,7 milliards de dollars, soit près de la moitié, proviennent de la valorisation comptable de ses participations dans Anthropic.

Sur un bénéfice du premier trimestre de 30,3 milliards de dollars d'Amazon, 16,8 milliards de dollars proviennent des gains non réalisés avant impôt d'Anthropic, tandis que son flux de trésorerie libre a chuté de 95 % pour s'établir à 1,2 milliard de dollars en raison de dépenses en capital pour les centres de données s'élevant à 44,2 milliards de dollars pendant la même période.

La durabilité de ce système dépend de la capacité des laboratoires d'IA à obtenir continuellement un financement externe pour honorer leurs engagements en matière de cloud computing, ce qui repose à son tour sur la volonté persistante des clients entreprises de payer des factures de jetons en constante augmentation.

Selon des rapports, Anthropic dépense actuellement jusqu'à 3 dollars pour chaque dollar de revenu généré. Une fois le rythme de financement ralenti, la crédibilité des prévisions de revenus cloud diminuera, et les multiples d'évaluation des fournisseurs de cloud à grande échelle subiront une pression de réévaluation.

Cette chaîne transmet dans les deux sens et se rompra également dans les deux sens.

Ce n'est pas 1999, mais le problème existe réellement

La situation actuelle ne constitue pas un scénario de bulle typique.

En termes de multiples d'évaluation, les sept géants technologiques sont actuellement valorisés à environ 20 fois leur PER futur, bien inférieur aux niveaux de 52 fois au sommet de la bulle technologique de 2000, 67 fois lors du pic du marché japonais en 1989 ou 34 fois à l'époque des « Beautiful Fifty ».

L'IA est une technologie réelle. Pour les utilisateurs intensifs, les données d'amélioration de la productivité sont vérifiables. OpenAI génère un revenu annuel d'environ 20 milliards de dollars, Anthropic environ 4,3 milliards de dollars ; ces deux laboratoires ne disparaîtront pas.

Aujourd'hui, le coût des tokens (consommation de puissance de calcul) est devenu un facteur déterminant pour le succès ou l'échec de l'IA, alors qu'il y a six mois, personne ne parlait presque de ce sujet.

À l'époque, tout le monde ne se préoccupait que de « si la technologie fonctionnait ». Aujourd'hui, la réponse est claire : dans certains domaines et auprès de certains groupes de personnes, la technologie fonctionne effectivement.

Mais une nouvelle question se pose : les économies réalisées par les entreprises en aval grâce à l’IA pourront-elles être transmises rapidement en amont, pour devancer la fenêtre d’évaluation laissée par les marchés financiers aux laboratoires d’IA et aux géants du cloud ?

Les partisans de l'IA estiment que tant que la technologie continue de mûrir, le ROI des entreprises deviendra positif dans un délai de 1 à 1,5 an.

Les sceptiques pensent que davantage de cadres, comme McDonald, vont publiquement se plaindre du faible retour sur investissement de l'IA et commencer à réduire les budgets.

Les deux scénarios pourraient se produire simultanément, et le vainqueur n'est pas encore déterminé. La seule chose certaine est que le mensonge selon lequel « une augmentation de la consommation de jetons signifie un succès de la transition vers l'IA » a été démonté.

Une forte consommation de jetons ne signifie pas nécessairement une valeur commerciale ; ces deux bulles devront inévitablement éclater. La facture de l'IA est arrivée à échéance, mais qui paiera en fin de compte ? Cela reste encore inconnu.