Les géants de la technologie de la Silicon Valley restreignent l'utilisation des jetons IA par leurs employés face à la hausse des coûts

L'IA automatisera pour les entreprises les tâches que les employés détestent, et non celles qui génèrent des revenus.

Il y a quelques jours, GeekPark a rapporté que Microsoft, qui avait fortement misé sur l'IA, avait discrètement suspendu la plupart des licences Claude Code pour ses employés internes.

Cela est très étrange, car dans cette vague d'adoption de l'IA, le principal argument de vente pour les clients professionnels est « l'augmentation de l'efficacité ». Si cela améliore l'efficacité, pourquoi Microsoft arrête-t-il les employés d'utiliser Claude Code ?

Microsoft n'est pas la seule entreprise à agir ainsi ; « réduire la consommation de tokens » et cesser d'encourager les employés à pratiquer le Vibe Coding intensif est devenu une nouvelle tendance chez les grandes entreprises de la Silicon Valley.

Uber a épuisé son budget annuel de jetons AI en quatre mois. Salesforce émet chaque année des chèques d'environ 300 millions de dollars à Anthropic. Un conseiller en IA a révélé qu'un de ses clients dépense jusqu'à 500 millions de dollars par mois en IA. Meta a même discrètement supprimé son classement interne « tokenmaxxing » — qui était initialement conçu pour encourager les employés à utiliser davantage l'IA.

Aujourd'hui, les entreprises accomplissent une chose que personne n'osait imaginer il y a quelques années :

Restreindre et surveiller l'utilisation de l'IA par les employés.

Pourquoi les grandes entreprises se tournent-elles toutes vers cela ?

« Tokenmaxxing », reflet de l'époque

Pour comprendre la crise des coûts d'aujourd'hui, il faut d'abord comprendre ce qu'est le « tokenmaxxing ».

Ce terme est devenu populaire vers 2025 et signifie littéralement « maximiser l'utilisation des tokens ». Il repose sur une logique de gestion : puisque l'entreprise a investi massivement dans des outils d'IA, les employés devraient les utiliser au maximum ; plus ils les utilisent, plus ils démontrent leur engagement dans la transformation numérique, et moins ils les utilisent, plus ils gaspillent des ressources. De nombreuses entreprises ont donc mis en place des quotas d'utilisation, des classements, voire des évaluations de performance, pour pousser les employés à adopter l'IA.

Et le résultat ?

Les employés commencent à utiliser le modèle d'IA enterprise de l'entreprise pour vérifier la météo, rédiger des messages d'anniversaire et demander quoi manger aujourd'hui.

Une étude portant sur 2 444 entreprises a révélé que pour chaque dollar dépensé sur des jetons AI, 0,44 dollar sont consacrés à la correction des bogues générés par l'IA, 0,27 dollar à la réécriture du code produit par l'IA, et 0,11 dollar à des retards dans l'examen et la fusion.

Autrement dit, pour chaque dollar de coût d'achat de l'IA, près de 80 % de pertes implicites sont cachées.

L'investisseur Shruti Gandhi a utilisé une métaphore très juste : « Les entreprises qui tokenmaxxent, c'est comme des entreprises qui mesurent leur productivité en laissant toutes les lumières allumées — dépenser plus d'argent ne signifie pas produire davantage. »

Plus ironique encore, la plupart de ces entreprises ne savent même pas ce que leurs employés font avec l’IA, ni si la réalisation de ces tâches a été modifiée par l’IA.

Cette « course aux dépenses » a duré de 2024 à 2025, et a enfin explosé cette année. JPMorgan a publié un rapport aux termes sévères, intitulé de manière directe et dérangeante : « Les coûts des tokens AI consomment les bénéfices d’Internet ».

Shopify, Spotify, ServiceNow et Roku ont tous mentionné lors de leurs conférences téléphoniques sur les résultats que l'IA est devenue la principale source de pression sur les dépenses opérationnelles. L'atmosphère globale du secteur commence à passer de « L'IA, c'est génial » à « Est-ce que cette dépense en vaut vraiment la peine ? »

Lorsque le PDG commence à remettre en question le ROI

Seuls 14 % des CFO déclarent voir un retour sur investissement clair et mesurable de l'IA.

Andrew Macdonald, PDG des opérations d'Uber, a déclaré avec franchise dans un podcast qu'il leur était difficile de relier l'amélioration de la productivité individuelle des employés à l'impact global sur l'activité de l'entreprise. « Si vous ne voyez pas comment l'IA vous aide à proposer aux utilisateurs des fonctionnalités précieuses, il est encore plus difficile de justifier les coûts en tokens. »

This highlights the core of the corporate AI dilemma: increased individual efficiency does not equate to increased company revenue.

Les employés utilisent l'IA pour rédiger leurs rapports hebdomadaires trois fois plus vite, mais le chiffre d'affaires de l'entreprise n'a pas changé. Les ingénieurs utilisent l'IA pour générer du code deux fois plus rapidement, mais le « taux de fuite » du code — c'est-à-dire le pourcentage abandonné ou réécrit — a augmenté de 800 %.

L'ancienne directrice principale de l'IA de Microsoft, Sophia Velastegui, a dit une phrase qui met mal à l'aise de nombreux gestionnaires : « La plupart des gens automatisent par défaut les tâches qu'ils n'aiment pas, et non celles qui apportent le plus de valeur à l'entreprise. »

En clair, l'automatisation des entreprises cible les tâches que les employés détestent, et non celles qui génèrent des revenus.

Ce n'est pas un problème technique, c'est une question de priorité. C'est aussi la raison pour laquelle environ 30 % des projets d'IA générative sont abandonnés à l'étape de preuve de concept — les coûts ne sont pas clairs, la valeur non plus, et le patron ne renouvelle donc pas le financement.

La manière dont Marc Benioff, PDG de Salesforce, gère la situation est représentative. Face à une facture annuelle de 300 millions de dollars pour Anthropic, il attend un « routeur intelligent » : capable de déterminer quelles requêtes méritent un modèle de pointe et lesquelles peuvent être traitées avec un modèle petit et moins coûteux.

L'idée en elle-même n'est pas nouvelle — dès l'ère du cloud computing, le paiement à l'usage et l'optimisation des ressources étaient des pratiques standard. Mais cette vague d'IA est arrivée si vite que tout le monde a acheté avant de réfléchir, et commence maintenant à rattraper son retard.

Retour au rationnel, ou prélude à l'hiver ?

Microsoft a récemment annulé la majorité des licences professionnelles de Claude Code, citant officiellement des facteurs de coût. Cet événement a suscité un vif débat dans le secteur — après tout, Microsoft est le principal investisseur d'OpenAI, tout en supprimant les abonnements à un concurrent. Il est difficile de déterminer dans quelle mesure cette décision relève de considérations de coût ou de stratégie.

But in any case, it represents a signal: companies are beginning to vote with their feet.

Harness et CloudZero ont presque simultanément publié, le 28 mai, des outils de gestion des coûts IA : l'un met l'accent sur la surveillance en temps réel des dépenses IA et du ROI, tandis que l'autre lance une « plateforme de contrôle financier IA » pour lier chaque dollar dépensé en IA à des résultats commerciaux concrets.

La simple apparition de ces deux produits en dit long : le marché a une demande, et cette demande est urgente.

HubSpot a modifié son modèle de tarification pour les agents IA à partir d'avril de cette année, passant d'une facturation au token à une facturation basée sur le « nombre de conversations résolues » ou le « nombre de pistes générées » — un changement stratégique qui aligne les intérêts des vendeurs sur les résultats réels des clients. ServiceNow effectue des ajustements similaires. Les fournisseurs d'IA comprennent progressivement que, s'ils continuent à vendre de la « consommation » plutôt que des « résultats », leurs clients entreprises finiront par réagir collectivement.

Ce ajustement est-il la douleur inévitable de l'industrialisation de l'IA, ou le prélude à une crise plus grande ?

Je tends à penser que c’est le premier cas. Mais un détail est un peu inquiétant : les dépenses mondiales en logiciels d’IA devraient atteindre 2 590 milliards de dollars en 2026, soit une augmentation de 47 % en glissement annuel, tandis que 94 % des responsables ingénierie affirment que les indicateurs clés de retour sur investissement sont toujours absents. Plus d’argent est dépensé, mais personne ne sait où il est utilisé ou s’il est bien utilisé — si cette contradiction n’est pas résolue, le prochain « moment tokenmaxxing » n’est qu’une question de temps.

Un article d'analyse de Fortune le dit clairement : « Tokenmaxxing est facile, redessiner les processus est difficile. » La plupart des entreprises actuelles se concentrent sur l'optimisation de leurs processus existants, et non sur la réinvention de leur modèle économique. C'est là que réside la véritable valeur de l'IA, et c'est là où la plupart des entreprises n'ont pas encore atteint.

Le retour à la rationalité est une bonne chose. Mais après ce retour à la rationalité, les entreprises doivent répondre à une question encore plus difficile : l’IA doit-elle être pour notre activité un marteau ou un nouveau cadre de réflexion ?

Si vous utilisez simplement l’IA pour faire plus vite les anciennes tâches, la facture finira un jour par vous ramener à cette question.

Cet article provient du compte WeChat « GeekPark » (ID : geekpark), auteur : Hua Lin Wu Wang, éditeur : Jingyu