Après avoir adopté l'IA, l'entreprise semble devenir plus pa

Après avoir adopté l'IA, l'entreprise semble devenir plus pauvre. Au début de l'apparition de l'IA, les patrons pensaient que c'était l'occasion de licencier et de réduire les coûts. Ils imaginaient qu'un seul IA pouvait remplacer trois personnes, ne dormait jamais, était disponible à tout moment, ne nécessitait pas d'augmentation de salaire, pas de sécurité sociale, et fonctionnait 24 heures sur 24. Cela semblait parfait. Mais la réalité est que l'IA ne traîne pas, ne travaille pas en heures supplémentaires — elle se contente simplement de facturer davantage à chaque fois qu'elle effectue une tâche supplémentaire. Aujourd'hui, de nombreuses entreprises commencent à s'écrier : « On ne peut plus se permettre de brûler des tokens. » Beaucoup réagissent en pensant : « C’est exagéré ! L’IA n’est-elle pas de plus en plus bon marché ? Après la sortie de DeepSeek, on ne disait pas que les coûts des grands modèles avaient été réduits ? » Mais beaucoup ignorent un fait : les modèles ont baissé en prix, mais les entreprises les utilisent de plus en plus intensément. De l’utilisation occasionnelle par une personne à l’adoption généralisée par tous les employés, puis à la mise en œuvre de dizaines d’agents qui tournent en arrière-plan 24 heures sur 24, le coût par appel a diminué — mais la facture mensuelle ne cesse d’augmenter. Par exemple, Uber a ouvert Claude Code à 5 000 ingénieurs ; en quelques mois, ils ont presque épuisé leur budget annuel d’IA. Microsoft commence également à freiner, en restreignant l’accès interne à Claude Code et en ne permettant plus aux ingénieurs de l’utiliser sans limite. En clair, la phase où « on pouvait l’utiliser comme on voulait » est terminée. Amazon est allé encore plus loin : il a supprimé complètement le classement interne de l’utilisation de l’IA. La raison est simple : ils ont découvert que lorsque « combien d’IA vous utilisez » devient un indicateur de performance, les employés se mettent à surconsommer des tokens pour grimper au classement. Il semble que tout le monde adopte activement l’IA, mais en réalité, beaucoup d’appels n’ont aucune valeur réelle — ils sont faits simplement « pour utiliser ». Lors d’une expérience avec plusieurs agents, MiHoYo a vu des dizaines d’agents s’appeler mutuellement, s’attendre mutuellement, se confirmer mutuellement : vous me posez une question, je vous réponds, vous me confirmez à nouveau — personne ne termine jamais vraiment. La chaîne d’appels s’allongeait sans cesse. Au final, une seule nuit a consommé environ 2 millions de yuans en tokens, tandis que la valeur réellement produite était négligeable. À ce stade, beaucoup se demandent : qu’est-ce qu’un token ? Comment peut-il faire brûler autant d’argent à une entreprise ? En réalité, un token peut être compris comme l’électricité dans le monde de l’IA. Quand vous posez une question dans un chat, l’IA répond en quelques secondes — ça semble gratuit. Mais dans les systèmes d’entreprise, chaque phrase saisie, chaque réponse générée, chaque appel de modèle, chaque exécution d’outil par un agent — même les discussions entre IA elles-mêmes — consomment des tokens. Et surtout, le modèle de tarification de l’IA est complètement différent de celui des logiciels traditionnels. Autrefois, lorsqu’on achetait un logiciel, le coût était fixe : un abonnement à x euros par an, et on pouvait prévoir le budget annuel avec précision. L’IA, elle, est facturée à l’utilisation — et cette utilisation augmente continuellement avec la complexité des processus. Un employé qui pose quelques questions occasionnelles coûte peu ; une équipe entière qui l’utilise fait grimper les frais ; quand on ajoute des agents qui font appel à d’autres agents, la facture passe facilement de quelques milliers à des dizaines ou des centaines de milliers d’euros. Pourtant, ces deux dernières années, la société entière a encouragé tout le monde à utiliser davantage l’IA : augmenter la pénétration de l’IA, augmenter la fréquence d’utilisation, augmenter l’automatisation. Certaines entreprises ont même intégré la consommation de tokens dans leurs évaluations de performance. En économie, il existe une loi classique appelée la loi de Goodhart : « Lorsqu’un indicateur devient un objectif, il cesse d’être un bon indicateur. » À l’étranger, on a même inventé un mot spécifique : « Tokenmaxxing », qui peut être traduit par « pousser la consommation de tokens à son maximum ». Certains font répéter à l’IA la même optimisation de code une trentaine de fois ; d’autres lui demandent de générer une douzaine de versions d’un rapport en une seule fois. D’autres encore décomposent une tâche simple en plusieurs étapes gérées par des agents distincts — uniquement pour que le système semble plus intelligent. L’IA devient peu à peu un décor vide. Les dépenses ponctuelles peuvent encore être supportées — mais ce qui pousse vraiment les coûts hors contrôle, ce sont les systèmes multi-agents. Théoriquement, ce système est magnifique : un agent pour planifier, un autre pour exécuter, un autre pour vérifier, un autre pour résumer — comme une équipe numérique parfaitement coordonnée. Mais dans la pratique, il ressemble davantage à une réunion sans animateur. Vous me demandez, je vous demande ; vous m’attendez, je vous attends ; une confirmation ne suffit pas — il faut en faire une autre. Tout le monde bouge — mais rien ne se termine jamais. Dans la plupart des systèmes multi-agents, entre 30 % et 60 % des tokens sont consommés dans ces cycles sans fin. En clair : une grande partie de l’argent ne se transforme pas en résultats — il est simplement brûlé pendant que les IA se « réunissent » entre elles. Ce qui est encore plus ironique, c’est que ces agents ne sont pas paresseux — au contraire, ils sont trop sérieux. Ils suivent scrupuleusement chaque étape logique : un agent appelle le suivant, qui revient confirmer le premier — jusqu’à ce que tout le système s’enfonce dans un cercle vicieux. C’est comme si une entreprise avait une réunion avec des dizaines de personnes qui débattent du soir jusqu’au lendemain matin : tout le monde parle avec passion — mais personne ne prend de décision. Et cette réunion est facturée à la seconde. Le problème fondamental est que ce type de « réunion » est constamment dupliqué, décomposé et imbriqué. Plus la taille augmente, plus les coûts explosent exponentiellement. Car le coût de l’IA n’est jamais unique — il s’amplifie continuellement avec la chaîne d’appels et est presque imprévisible. À ce stade, on ne discute plus « si l’IA est utile ou non » — on calcule quelque chose de plus concret : cette technologie va-t-elle faire exploser notre facture ? Les modèles nationaux comme DeepSeek ou DouBao sont soudainement remis sur la table — pas par nostalgie, mais parce qu’on réalise une vérité simple : pour la même tâche, ils peuvent coûter plusieurs fois moins cher. En clair : arrêtez d’utiliser systématiquement les modèles les plus chers. Les tâches simples sont confiées aux modèles économiques ; seules les tâches complexes méritent les grands modèles. Les entreprises commencent à comprendre que l’IA n’est pas un outil « plus on en utilise, mieux c’est » — c’est plutôt un système « plus on en utilise, plus on brûle d’argent ». Le marché financier suit aussi ce changement : autrefois, on évaluait les entreprises d’IA selon leur volume d’appels, leur croissance rapide ou leur consommation massive de tokens. Aujourd’hui, on ne regarde qu’une chose : le ROI. Vous brûlez tant de tokens — avez-vous récupéré de l’argent ? Une réalité cruelle : améliorer l’efficacité ne signifie pas forcément gagner de l’argent. Si vous écrivez du code deux fois plus vite mais que votre produit ne vend pas une unité supplémentaire, vous n’êtes pas en train de gagner — vous êtes juste en train de dépenser plus vite. Ce qui est encore plus absurde, c’est que ce phénomène ne concerne pas seulement quelques entreprises isolées. Certaines ont dépensé 500 millions de dollars en un seul mois sur Claude ; d’autres ont oublié de fixer une limite et ont vu leur consommation de tokens exploser. Chez Meta, c’était encore pire : ils avaient même créé un classement interne appelé « Claudeonomics », pour voir qui utilisait le plus l’IA. Le premier a consommé 31 200 milliards de tokens en un mois. Converti en argent : cela équivaut au salaire annuel de deux ingénieurs expérimentés. On peut dire qu’en parallèle du slogan « Tout le monde doit passer à l’IA », les comptables commencent à transpirer. En fin de compte, il ne s’agit pas de ne pas utiliser l’IA — mais d’arrêter de brûler des tokens sans réflexion.Les gens commencent à se poser une question plus réaliste : ces tokens, ont-ils vraiment été échangés contre de l'argent réel ? #AI #AIAgent @grok