Microsoft suspende el uso interno de Claude Code ya que los costos de los tokens de IA superan los gastos de los empleados

El 14 de mayo de 2026, Microsoft ha comenzado a cancelar las licencias internas de Claude Code para la mayoría de sus empleados. La fecha límite es el 30 de junio, que también es el último día del año fiscal de Microsoft.

Solo hace seis meses, Microsoft estaba haciendo exactamente lo contrario: en diciembre de 2025, liberó Claude Code a miles de empleados, incluidos ingenieros, product managers y diseñadores, animando a todos a redefinir sus flujos de trabajo con el enfoque de vibe coding. A los empleados les encantó esta herramienta, pero quizás demasiado.

Pero seis meses después, Microsoft lo retiró por sí misma.

Y casi en la misma semana, Tom Blomfield, socio de YC, dijo otra frase en una charla de batch: «Si tu factura de API no te duele, significa que no estás gastando lo suficiente».

En la misma primavera, Silicon Valley está ofreciendo dos respuestas completamente opuestas a la misma pregunta: ¿es realmente más caro usar IA que a personas?

Escena del fracaso de 01 vibe coding

Microsoft no canceló el modelo Claude. Los modelos de Anthropic seguirán estando disponibles para los empleados de Microsoft a través de Copilot CLI. Lo que canceló fue la entrada del producto Claude Code en sí.

El departamento más afectado es «Experiences + Devices»: el equipo de ingenieros detrás de Windows, Microsoft 365, Outlook, Teams y Surface. El EVP Rajesh Jha presentó esta decisión en un memorándum interno como «unificación de la cadena de herramientas», pero según fuentes internas de Microsoft citadas por The Verge, la realidad es más directa: los empleados consideran que Claude Code es más fácil de usar que Copilot CLI, y la popularidad de la herramienta de Anthropic dentro de Microsoft ha llevado a que el propio Copilot CLI sea «ignorado».

En otras palabras, Microsoft retiró Claude Code no porque no funcione, sino porque funciona demasiado bien.

La fecha límite del 30 de junio tampoco es una coincidencia: es el último día del año fiscal de Microsoft. Eliminar una herramienta ampliamente preferida por los empleados y reemplazarla con un producto propio, justo en el momento del cierre fiscal: todos saben cuánto hay de juicio de producto y cuánto de consideraciones financieras.

Claude Code

Microsoft no es un caso aislado.

Hace un mes, el CTO de Uber, Praveen Neppalli Naga, reveló a The Information que el presupuesto anual de la empresa para herramientas de programación de IA en 2026 se agotó en los primeros cuatro meses. Uber había creado previamente un ranking interno, utilizando una competencia para incentivar a los empleados a usar más la IA, lo que resultó en el colapso del presupuesto.

Más directamente, Bryan Catanzaro, vicepresidente de aprendizaje profundo en NVIDIA, dijo en una entrevista con Axios: «Para mi equipo, el costo de la capacidad de cómputo supera con creces el costo de los empleados». Esto proviene de un ejecutivo de una empresa de hardware cuyo producto principal es precisamente vender capacidad de cómputo.

Fortune conecta estas pistas y le pone un título muy Fortune al artículo: «El informe de Microsoft revela el verdadero problema de costo de la IA: usar esto cuesta más que mantener empleados».

Si solo llegas a este nivel, la conclusión es sencilla: el vibe coding fracasó, y la historia de que la IA reemplaza a los humanos puede cerrarse.

Pero esta conclusión es prematura.

02 El modo Copilot ya ha «chocado contra la pared»

Para explicar el retiro de Microsoft, primero hay que entender qué es el vibe coding.

Esta palabra fue propuesta por Andrej Karpathy a principios de 2025: describió un nuevo enfoque de programación en el que los desarrolladores ya no escriben código línea por línea, sino que describen su intención en lenguaje natural y permiten que el LLM genere el código. Los desarrolladores ni siquiera leen el código, solo revisan el resultado: si funciona, lo aceptan; si no funciona, piden al AI que lo revise nuevamente.

Esta es la promesa de productividad más atractiva de la era de la IA. Significa: un ingeniero que no sabe Rust puede hacer que la IA le escriba Rust; un product manager puede hacer que la IA le cree un prototipo; un diseñador puede hacer que la IA le genere código funcional. El grupo al que Microsoft abrió Claude Code en diciembre de 2025 —ingenieros, PMs, diseñadores— coincide exactamente con estas tres categorías. No es una coincidencia; es la forma más clásica de implementar el vibe coding.

Pero cuando el vibe coding llega a una gran empresa, se vuelve algo estructuralmente incómodo.

Supongamos que Microsoft tiene un ingeniero con un salario anual de 300.000 dólares. Después de proporcionarle a este ingeniero a Claude Code, su productividad aumenta un 20 %: este es el estado ideal del vibe coding. Pero, ¿cuál es el costo mensual de los tokens que consume: 200 dólares, 500 dólares o 2.000 dólares? Esta cifra aumentará de forma monotónica a medida que su dependencia de la IA crezca.

Lo más molesto es que no será despedido por «haber usado IA»: su salario de 300.000 dólares anuales sigue allí, sus beneficios siguen allí, y su puesto de trabajo sigue allí.

Es decir, la estructura de costos total de Microsoft es «el salario original de los empleados + la nueva factura de tokens». Esta fórmula tiene solo una dirección: un aumento masivo de los costos.

Claude Code

¿Pero acaso el hecho de que la "producción de los empleados aumente un 20 %" se refleja financieramente como un "ingreso +20 %"? No. Lo que ocurre es que "el ingreso se mantiene constante, pero en la estructura de costos aparece una nueva factura de IA": porque la mayor parte de la producción de los empleados no se traduce directamente en ingresos adicionales; escribir más rápido no significa que la empresa venda más.

Esa es la verdadera significación de la frase de Catanzaro: «La potencia de cálculo es más cara que los empleados». No significa que la IA sea tonta, sino que cuando colocas la IA en el lugar de los empleados originales, no puedes hacer que las cuentas cuadren.

Este lógica también tiene soporte de datos.

Un reciente pronóstico de Gartner indica que, para 2030, el costo de inferencia de modelos grandes con un billón de parámetros disminuirá casi un 90% en comparación con 2025. Parece que la IA se está volviendo más barata, pero la conclusión real de Gartner es que esto no reducirá la factura total de IA de las empresas. El analista senior de Gartner, Will Sommer, dijo: "Los CPO no deben confundir la deflación de tokens de nivel comercial con la democratización de la capacidad de inferencia de vanguardia".

La predicción de Goldman Sachs es más directa: para 2030, la IA agente impulsará un aumento de 24 veces en el consumo de tokens, alcanzando 120 exabytes mensuales. A pesar de una caída del 90% en el precio por token y un aumento de 24 veces en el consumo, la factura total sigue aumentando.

Jensen Huang tiene una versión más agresiva. Hace varios meses, en público, dijo que en el futuro, cada empleado de NVIDIA trabajará junto a 100 agentes de IA.

Suena hermoso. Pero si fueras CFO, ¿qué escucharías? 100 tokens quemándose en un horno, 24 horas al día, sin parar.

El problema no es que la IA sea demasiado cara. El problema es la suposición misma de "darle a cada empleado un copiloto de IA".

Este enfoque tiene un nombre popular en el mundo tecnológico: «modo copiloto» (copilot mode). Su suposición fundamental es que el ser humano sigue en el asiento del conductor, mientras que la IA ofrece sugerencias desde el asiento del copiloto. No te reemplaza, simplemente te hace más rápido.

Esta suposición es muy suave en términos textuales: «La IA no te quitará tu trabajo, la IA solo te ayudará». Pero en términos financieros, su implicación es: los salarios originales permanecen iguales, pero se agrega un costo adicional en tokens.

Además, los tokens no son un costo fijo, sino que se cobran según el consumo. Cuanto más utilicen los empleados, más pagará la empresa: exactamente la estructura de costos que las empresas más desean evitar: variable, sin límite superior y que se amplifica en proporción inversa a la capacidad.

Cuando Microsoft lanzó Claude Code en diciembre de 2025, probablemente no se dio cuenta completamente de esto. Originalmente, pensaba: "Dejemos que los empleados lo prueben y veamos cuánto puede mejorar la productividad con IA". Pero seis meses después, los empleados se volvieron adictos; Claude Code se volvió extremadamente popular dentro de Microsoft—resultando en facturas de tokens mucho más altas de lo esperado, superando los rendimientos que Microsoft podía recuperar de esta popularidad.

Microsoft retiró. Pero lo que retiró no fue la IA, sino la estructura de «los empleados en el asiento del conductor y la IA en el asiento del copiloto».

Este es un fracaso estructural. No desaparecerá porque el modelo sea más barato, ni porque los empleados sean más hábiles; se volverá más grave a medida que los empleados se vuelvan más hábiles con la IA.

03 Quemar tokens es porque no se queman cabezas

Casi en la misma semana en que Microsoft se retiró, Tom Blomfield presentó una perspectiva completamente diferente en el batch talk de YC. En lugar de discutir «cómo usar la IA», habló sobre «cómo deberían ser las empresas en la era de la IA».

Claude Code

El juicio de Blomfield es directo: hoy en día, la mayoría de las empresas aún tienen una estructura tipo "legión romana": la información se transmite hacia arriba por niveles, las órdenes se distribuyen hacia abajo por niveles, y las personas son el núcleo de la coordinación. Colocar IA en esta estructura es como entregar armas de fuego a los infantes romanos: las usarán con más intensidad, pero la táctica no cambiará.

Una verdadera empresa nativa de IA debería ser de otra manera.

Blomfield usó una descripción muy específica: cada acción debería generar un producto registrable y llamable, haciendo que todo sea legible para la IA; la empresa debería diseñarse como un "ciclo de IA de auto-mejora", donde el sistema pueda percibir el entorno, tomar decisiones, llamar herramientas, recibir retroalimentación y autocorregirse.

En esta empresa, solo existen dos roles: uno es el contribuidor individual — cada persona, sin importar el departamento, es un builder y un operator, y lleva prototipos a las reuniones, no solo ideas; el otro es el DRI (responsable directo) — cada resultado tiene un responsable claro, «no se puede esconder detrás de la IA».

Luego Blomfield dijo la frase célebre: "Si tu factura de API no te duele, significa que no estás quemando lo suficiente."

Esta frase sería considerada una broma en la oficina del CFO de Microsoft; pero frente a un grupo de fundadores de startups en YC, nadie la considera loca.

Why?

Otro socio de YC, Diana Hu, dio la respuesta en Startup School a principios de mayo. Dijo una frase: «Lo que se maximiza no es el número de personas, sino el consumo de tokens». También tiene una versión más directa: «Una persona con herramientas de IA equivale a un gran equipo de ingenieros del pasado».

Observe la palabra clave aquí: «igual». No «equivalente», no «similar»: es reemplazo.

En el lote de primavera de 2026 de YC, muchas empresas ya están utilizando a 5 o 6 personas para hacer lo que antes requería 20 o 30. Sus facturas de tokens son altas, pero sus facturas de personal son extremadamente bajas; en general, están ganando dinero.

Un caso más agresivo es Block. Esta empresa de tecnología financiera, propiedad de Jack Dorsey, recientemente despidió al 40 % de su personal. Esto no es un "recorte de costos y mejora de eficiencia" en el sentido tradicional: Block también aumentó su inversión interna en herramientas de IA, y la nueva estructura es precisamente la que Diana Hu describió: IC + DRI + agente de IA.

Quemar tokens en el contexto de YC no es un gasto, es un reemplazo. No reemplaza los gastos fuera de la IA, sino los salarios del personal. La cuenta cierra porque la empresa eliminó simultáneamente los puestos que originalmente requerían salarios.

Esta es la razón fundamental por la que Microsoft y YC ven lo mismo pero dan respuestas opuestas: no están quemando el mismo tipo de token. El token de Microsoft es para repostar al copiloto del equipo original, mientras que el token de YC reemplaza al conductor original.

04 Los activos reales están siendo redefinidos

Tom Blomfield también dijo otra frase más significativa en la conversación: «Las personas son efímeras; lo importante son los documentos de contexto.»

Esta es una evaluación a nivel contable.

¿Cómo se escribe el balance general de una empresa tradicional? A la izquierda están los activos fijos, los cuentas por cobrar, el goodwill y la propiedad intelectual; a la derecha, los pasivos y el patrimonio de los accionistas. Los empleados no aparecen en el lado de los activos: los empleados son un costo. Pero cada empresa sabe en su interior que los empleados son realmente el verdadero activo: las relaciones con los clientes están en la mente de los vendedores, la intuición comercial en la mente del product manager y el know-how técnico en la mente de los ingenieros.

La característica de este «activo» es que se va. Cuando un empleado se va, el activo se va con él.

Y la empresa nativa de IA descrita por Blomfield está haciendo una cosa: extraer todos estos activos que antes solo existían en la mente humana y convertirlos en "activos de contexto" legibles, invocables y iterables por la IA.

¿Cuál es la forma específica? Es un documento de requisitos detallado; es un documento de proceso que registra cada decisión, cada intercambio de correos electrónicos y cada discusión en Slack; es una interfaz MCP y una API abiertas; son los artefactos generados por cada herramienta interna: todos estos elementos conforman una nueva capa de activos para la empresa, que es heredable y no desaparece con la salida de los empleados.

Las personas en esta empresa se convierten en una «variable»: se pueden integrar rápidamente y también salir rápidamente, porque el activo principal de la empresa no está en la mente humana, sino en los documentos.

Claude Code

Si este modelo se confirma, significa algo más que un nuevo modelo organizativo: significa que los estados financieros de las empresas están siendo reescritos. Una empresa nativa de IA con solo seis personas y facturas de tokens sorprendentemente altas puede parecer financieramente inestable, pero sus activos reales podrían ser más valiosos que los de una empresa tradicional de sesenta personas: simplemente, las normas contables actuales aún no han aprendido a calcular estos activos.

En otras palabras, el vibe coding no ha muerto; simplemente no pertenece a las empresas tradicionales.

El día en que Microsoft retiró Claude Code, no fue un día de fracaso de la economía de la IA, sino un día en que una postura de encajar la IA en organizaciones antiguas fue refutada por sí misma.

En esa habitación de startups de YC, está surgiendo otro enfoque: son pequeñas, gastan, no tienen «tasa de uso de IA por empleados» en sus tablas de KPI, y su CFO no se desespera por el aumento repentino de las facturas de tokens—porque lo que están gastando no es «el copiloto del empleado», sino «el reemplazo del empleado».

En los próximos años, todas las empresas medianas que aún estén pidiendo a sus empleados «usar más AI» chocarán contra el mismo muro que Microsoft enfrentó: facturas de tokens con aumentos estructurales.

Pero la verdadera razón del choque contra el muro no es que la IA sea demasiado cara, sino que la organización aún no ha cambiado.

Y la gran mayoría de las empresas, probablemente, no cambiarán en un corto plazo.