Microsoft arrête l'utilisation interne de Claude Code car les coûts des jetons IA dépassent les dépenses salariales

Le 14 mai 2026, Microsoft a commencé à révoquer les licences internes Claude Code pour la majorité de ses employés. La date limite est le 30 juin — également le dernier jour de l'exercice financier de Microsoft.

Il y a seulement six mois, Microsoft faisait exactement le contraire — en décembre 2025, il a ouvert Claude Code à des milliers d'employés, y compris des ingénieurs, des produits managers et des designers, en les encourageant à réinventer leurs flux de travail avec la méthode vibe coding. Les employés ont adoré cet outil, mais peut-être trop.

Mais six mois plus tard, Microsoft a retiré cela.

Et presque en même temps, Tom Blomfield, associé de YC, a déclaré lors d’une batch talk : « Si votre facture API ne vous fait pas souffrir, c’est que vous ne dépensez pas assez. »

Au même printemps, la Silicon Valley apporte deux réponses totalement opposées à la même question : l’IA est-elle plus chère que les humains ?

Le lieu d'échec de 01 vibe coding

Microsoft n'a pas supprimé le modèle Claude. Les modèles d'Anthropic continueront d'être disponibles pour les employés de Microsoft via Copilot CLI. Ce qu'elle a supprimé, c'est l'entrée produit elle-même, Claude Code.

Le département le plus touché est « Experiences + Devices » — l'équipe d'ingénieurs derrière Windows, Microsoft 365, Outlook, Teams et Surface. Dans une note interne, l'EVP Rajesh Jha a présenté cette décision comme une « unification des chaînes d'outils », mais selon des sources internes de Microsoft citées par The Verge, la réalité est plus directe : les employés trouvent Claude Code plus facile à utiliser que Copilot CLI, et l'outil d'Anthropic est tellement populaire au sein de Microsoft que Copilot CLI a été « laissé de côté ».

En d'autres termes, Microsoft a supprimé Claude Code non parce qu'il ne fonctionne pas, mais parce qu'il fonctionne trop bien.

La date limite du 30 juin n'est pas une coïncidence — c'est le dernier jour de l'exercice financier de Microsoft. Supprimer un outil largement préféré par les employés pour le remplacer par un produit interne, en choisissant précisément ce moment de l'exercice financier — combien de cela relève du jugement produit, combien de cela relève de considérations financières, tout le monde le sait.

Claude Code

Microsoft n'est pas un cas isolé.

Il y a un mois, Praveen Neppalli Naga, CTO d'Uber, a révélé à The Information que le budget annuel de l'entreprise pour les outils de programmation IA en 2026 avait été entièrement dépensé au cours des quatre premiers mois. Uber avait précédemment mis en place un classement interne, utilisant un concours pour encourager les employés à utiliser davantage l'IA — le résultat fut une défaillance budgétaire.

Plus directement, Bryan Catanzaro, vice-président de l’application de l’apprentissage profond chez NVIDIA, a déclaré lors d’un entretien avec Axios : « Pour mon équipe, le coût du calcul dépasse largement le coût des employés. » C’est une déclaration provenant d’un dirigeant d’une entreprise de matériel — dont le produit principal est la vente de puissance de calcul.

Fortune a lié ces indices pour donner à l'article un titre typiquement Fortune : « Le rapport de Microsoft révèle le véritable coût de l'IA — utiliser cet outil coûte plus cher que d'entretenir des employés ».

Si vous n'avez lu que jusqu'à ce niveau, la conclusion est simple : le vibe coding a échoué, l'histoire de l'IA remplaçant les humains peut être classée.

Mais cette conclusion est prématurée.

02 Le mode Copilot a « heurté un mur »

Pour expliquer le retrait de Microsoft, il faut d'abord comprendre ce qu'est le vibe coding.

Ce terme a été introduit par Andrej Karpathy au début de l'année 2025 — il décrit une nouvelle approche de la programmation : les développeurs ne plus écrire de code ligne par ligne, mais décrivent leur intention en langage naturel, laissant l'LLM générer le code. Les développeurs ne lisent même pas le code, ils ne regardent que le résultat — s'il fonctionne, ils l'acceptent ; sinon, ils demandent à l'IA de le réviser.

C'est la promesse de productivité la plus séduisante de l'ère de l'IA. Cela signifie : un ingénieur qui ne sait pas écrire en Rust peut faire aider l'IA à écrire du Rust ; un produit manager peut faire créer un prototype par l'IA ; un designer peut faire générer par l'IA du code fonctionnel. Les trois catégories de personnes auxquelles Microsoft a ouvert Claude Code en décembre 2025 — ingénieurs, PM, designers — correspondent exactement à ces trois profils. Ce n'est pas une coïncidence, c'est la mise en œuvre la plus classique du vibe coding.

Mais lorsque le vibe coding est appliqué dans les grandes entreprises, cela devient quelque chose de structurellement maladroit.

Supposons qu’un ingénieur de Microsoft gagne 300 000 dollars par an. Après lui avoir fourni un Claude Code, la productivité de cet ingénieur augmente de 20 % — ce qui correspond à l’état idéal du vibe coding. Mais combien coûte chaque mois la consommation de tokens : 200 dollars, 500 dollars ou 2 000 dollars ? Ce montant augmentera de manière monotone à mesure que son dépendance à l’IA s’intensifiera.

Plus problématique encore, il ne sera pas licencié pour avoir utilisé l’IA — son salaire de 300 000 dollars annuels, ses avantages et son bureau restent intacts.

Autrement dit, la structure des coûts totaux de Microsoft est « les salaires des employés d'origine + les nouvelles factures de jetons ». Cette formule ne va que dans un sens — une explosion des coûts.

Claude Code

Mais le fait que la « productivité des employés augmente de 20 % » ne se traduit pas financièrement par une « augmentation de 20 % du chiffre d’affaires ». Non, cela se traduit par « un chiffre d’affaires inchangé, mais avec une nouvelle ligne de dépense dans la structure des coûts : une facture AI » — car la majorité de la productivité des employés ne correspond pas directement à un revenu supplémentaire ; écrire plus vite ne signifie pas que l’entreprise vend davantage.

C'est exactement ce que Catanzaro voulait dire avec son affirmation selon laquelle « la puissance de calcul coûte plus cher que les employés ». Ce n'est pas que l'IA soit stupide, c'est que lorsque vous intégrez l'IA aux employés existants, vous ne pouvez pas équilibrer les comptes.

Cette logique est soutenue par des données.

Un récent rapport de Gartner prédit qu'entre 2025 et 2030, le coût d'inférence des grands modèles de un billion de paramètres diminuera de près de 90 %. Cela semble indiquer que l'IA devient de plus en plus abordable, mais la véritable conclusion de Gartner est que cela n'entraînera pas une réduction des coûts totaux d'IA pour les entreprises. L'analyste senior de Gartner, Will Sommer, a déclaré : « Les CPO ne doivent pas confondre la déflation des jetons de niveau commercial avec la démocratisation des capacités d'inférence de pointe. »

La prévision de Goldman Sachs est plus directe : d'ici 2030, l'IA agente fera grimper la consommation de tokens de 24 fois, atteignant 120 quadrillions par mois. Une baisse de 90 % du prix par token et une augmentation de 24 fois de la consommation — le montant total de la facture augmente toujours.

Jensen Huang a une version plus audacieuse. Il a déclaré publiquement il y a quelques mois que, dans le futur, chaque employé de NVIDIA travaillera aux côtés de 100 agents IA.

Cela semble magnifique. Mais si vous êtes le CFO, que entendez-vous ? Cent tokens brûlés en continu, 24 heures sur 24.

Le problème n'est pas que l'IA soit trop chère. Le problème est l'hypothèse même consistant à « fournir un copilote IA à chaque employé ».

Ce posture a un nom populaire dans le monde technologique : le « mode copilote » (copilot mode). Son hypothèse fondamentale est que l’humain reste au volant, tandis que l’IA, au siège passager, vous donne des conseils. Elle ne vous remplace pas, elle vous permet simplement d’aller plus vite.

Cette hypothèse est très douce au niveau du texte — « L’IA ne vous volera pas votre emploi, elle vous aide simplement ». Mais sur le plan financier, son implication est que votre salaire reste inchangé, mais qu’un frais supplémentaire en token est ajouté.

Les jetons ne sont pas un coût fixe, mais facturés à la consommation. Plus les employés en utilisent, plus l'entreprise paie — ce qui correspond exactement à la structure de coûts que les entreprises souhaitent éviter : variable, sans plafond, et qui s'amplifie inversement à la capacité.

Lorsque Microsoft a lancé Claude Code en décembre 2025, il n’avait peut-être pas pleinement conscience de cela. Son intention initiale était de permettre aux employés de l’essayer afin d’évaluer dans quelle mesure l’IA pouvait améliorer la productivité. Mais six mois plus tard, les employés étaient devenus accros ; Claude Code était devenu extrêmement populaire au sein de Microsoft — ce qui a entraîné des factures de tokens bien supérieures aux attentes, dépassant les gains que Microsoft pouvait espérer tirer de cette popularité.

Microsoft a retiré. Mais ce qu'il a retiré, ce n'est pas l'IA — c'est la structure selon laquelle les employés restent au volant et l'IA est au siège passager.

C'est un échec structurel. Il ne disparaîtra pas parce que le modèle est moins cher, ni parce que les employés sont plus compétents — il s'aggravera à mesure que les employés deviendront de plus en plus compétents avec l'IA.

03 Brûler des tokens, c'est parce qu'on ne brûle pas de têtes

Presque la même semaine que le retrait de Microsoft, Tom Blomfield a présenté une perspective complètement différente lors d’un batch talk de YC. Il n’a pas discuté de « comment utiliser l’IA » — il a parlé de « à quoi devraient ressembler les entreprises à l’ère de l’IA ».

Claude Code

Le jugement de Blomfield est direct : aujourd'hui, la plupart des entreprises ont encore une structure de type « légion romaine » — les informations remontent graduellement, les ordres descendent graduellement, et les humains sont au cœur de la coordination. Intégrer l'IA dans cette structure, c'est comme donner des armes à feu aux légionnaires romains — ils les utiliseront plus intensément, mais leur tactique ne changera pas.

Une véritable entreprise native AI devrait être différente.

Blomfield a utilisé une description précise : chaque action devrait produire un résultat enregistrable et appelable, rendant tout lisible pour l'IA ; l'entreprise devrait être conçue comme un « cycle d'IA auto-améliorante », où le système perçoit l'environnement, prend des décisions, appelle des outils, reçoit des retours et s'ajuste lui-même.

Dans cette entreprise, il ne reste que deux rôles : soit un contributeur individuel — chaque personne, quel que soit son département, est un builder et un operator, et apporte des prototypes aux réunions, pas seulement des idées ; soit un DRI (responsable direct) — chaque livrable a un responsable clairement désigné, « on ne peut pas se cacher derrière l’IA ».

Ensuite, Blomfield a prononcé cette phrase célèbre : « Si votre facture d'API ne vous fait pas souffrir, c'est que vous ne dépensez pas assez. »

Cette phrase serait considérée comme une blague dans le bureau du CFO de Microsoft ; mais devant un groupe de fondateurs de startups dans une salle de YC, personne ne la trouve folle.

Why?

L'autre partenaire de YC, Diana Hu, a donné la réponse lors de Startup School au début mai. Elle a dit une phrase : « L'objectif n'est pas de maximiser le nombre de personnes, mais la consommation de jetons. » Elle a également une version plus directe : « Une personne équipée d'outils d'IA équivaut à une grande équipe d'ingénieurs du passé. »

Notez le mot-clé ici : « égal ». Pas « équivalent à », pas « similaire à » — mais substitution.

Parmi la promotion P26 de printemps 2026 de YC, de nombreuses entreprises utilisent déjà 5 ou 6 personnes pour accomplir des tâches qui nécessitaient auparavant 20 à 30 personnes. Leurs factures de jetons sont bien sûr élevées, mais leurs factures de personnel sont extrêmement faibles — au total, elles réalisent des bénéfices.

Un cas plus radical est Block. Cette société de technologie financière, fondée par Jack Dorsey, a récemment licencié 40 % de ses employés. Il ne s'agit pas d'une « réduction des coûts et amélioration de l'efficacité » au sens traditionnel — Block a simultanément augmenté ses investissements internes dans les outils d'IA, créant une nouvelle structure telle que décrite par Diana Hu : IC + DRI + agent IA.

La brûlure de jetons dans le contexte de YC n'est pas une dépense, mais un remplacement. Elle ne remplace pas les coûts autres que l'IA, mais les salaires. Le bilan fonctionne parce que l'entreprise a simultanément supprimé les postes qui auraient autrement été consacrés aux salaires.

C'est la raison fondamentale pour laquelle Microsoft et YC voient la même chose mais donnent des réponses opposées — ils ne brûlent pas le même type de token. Le token de Microsoft alimente le passager du conducteur original, tandis que le token de YC remplace le conducteur lui-même.

04 Les actifs réels sont en train d'être redéfinis

Tom Blomfield a également dit une autre phrase plus significative lors de l'entretien : « Les individus sont éphémères, les documents contextuels sont ce qui compte. »

C'est un jugement au niveau comptable.

Comment les entreprises traditionnelles rédigent-elles leur bilan ? À gauche figurent les actifs fixes, les créances clients, la bonne volonté et la propriété intellectuelle ; à droite, les passifs et l'équité des actionnaires. Les employés n'apparaissent pas dans la colonne des actifs — ils sont considérés comme un coût. Mais chaque entreprise sait au fond d'elle-même que les employés sont en réalité les véritables actifs : les relations clients résident dans la tête des vendeurs, l'intuition métier dans celle des produits, et le savoir-faire technique dans celle des ingénieurs.

Ce type d'« actif » a pour caractéristique de s'en aller. Dès qu'un employé quitte l'entreprise, l'actif s'évapore.

Et les entreprises natives à l'IA décrites par Blomfield font une chose : extraire tous ces actifs qui n'existaient auparavant que dans l'esprit humain, pour les transformer en « actifs contextuels » lisibles, appelables et itérables par l'IA.

Quelle est la forme concrète ? C’est un document de besoins détaillé ; c’est un document de processus qui capture chaque décision, chaque échange par courriel, chaque discussion sur Slack ; c’est une interface MCP et des API ouvertes ; ce sont les artefacts générés par chaque outil interne — tous ces éléments constituent une nouvelle couche d’actifs pour l’entreprise, héritables et qui ne disparaissent pas avec le départ des employés.

Les personnes deviennent alors des « variables » au sein de cette entreprise — elles peuvent être intégrées rapidement et quittées facilement, car l'actif principal de l'entreprise ne réside pas dans les esprits, mais dans les documents.

Claude Code

Si cette structure s'avère valide, cela signifie bien plus qu'un nouveau modèle organisationnel — cela signifie que le bilan des entreprises est en train d'être réécrit. Une entreprise AI-native de six personnes, dépensant des quantités impressionnantes de tokens, peut sembler financièrement instable, mais ses véritables actifs pourraient être plus importants que ceux d'une entreprise traditionnelle de soixante personnes — seul problème : les normes comptables actuelles n'ont pas encore appris à les évaluer.

En d'autres termes, le vibe coding n'est pas mort. Il ne fait simplement pas partie des entreprises traditionnelles.

Le jour où Microsoft a retiré Claude Code, ce n'était pas une journée d'échec de l'économie de l'IA — mais une journée où la posture consistant à loger l'IA dans des organisations anciennes s'est auto-contredite.

Dans cet entrepôt de startups de YC, une autre approche est en train de voir le jour — elles sont petites, elles brûlent du cash, elles n’ont pas de « taux d’utilisation de l’IA par les employés » dans leurs tableaux de KPI, et leur CFO ne panique pas face à une explosion des factures en token — car ce qu’elles brûlent, ce n’est pas « le passager du siège du conducteur » des employés, mais « le remplaçant des employés ».

Au cours des prochaines années, toutes les entreprises de taille moyenne qui continueront à demander à leurs employés d'« utiliser davantage d'IA » heurteront le même mur que Microsoft : des factures de tokens dont les coûts augmentent de manière structurelle.

Mais la vraie raison de la collision n'est pas que l'IA soit trop chère — c'est que l'organisation n'a pas encore changé.

Et la grande majorité des entreprises ne changeront probablement pas de sitôt.