Microsoft suspende o uso interno do Claude Code porque os custos dos tokens de IA superam as despesas com funcionários

Em 14 de maio de 2026, a Microsoft começou a cancelar as licenças internas do Claude Code para a maioria dos funcionários. A data limite é 30 de junho — também o último dia do ano fiscal da Microsoft.

Apenas 6 meses atrás, a Microsoft estava fazendo exatamente o oposto — em dezembro de 2025, ela liberou o Claude Code para milhares de funcionários, incluindo engenheiros, gerentes de produto e designers, incentivando todos a redefinirem seus fluxos de trabalho com o vibe coding. Os funcionários adoraram essa ferramenta, mas talvez tenham se apaixonado demais.

Mas seis meses depois, a Microsoft retirou-se.

E quase na mesma semana, o sócio da YC, Tom Blomfield, disse outra frase em uma batch talk: “Se a sua fatura de API não doer, significa que você não está gastando o suficiente.”

Na mesma primavera, a Silicon Valley está oferecendo duas respostas completamente opostas para a mesma questão — usar IA é mais caro do que usar humanos?

Cena de falha do 01 vibe coding

A Microsoft não cancelou o modelo Claude. Os modelos da Anthropic continuarão a ser disponibilizados para os funcionários da Microsoft por meio do CLI do Copilot. O que foi cancelado foi o próprio ponto de entrada do produto Claude Code.

O departamento mais afetado foi o “Experiences + Devices” — a equipe de engenheiros por trás do Windows, Microsoft 365, Outlook, Teams e Surface. O EVP Rajesh Jha apresentou essa decisão na memória interna como “unificação da cadeia de ferramentas”, mas fontes internas da Microsoft citadas pelo The Verge foram mais diretas: os funcionários consideram o Claude Code mais fácil de usar do que o Copilot CLI, e a popularidade da ferramenta da Anthropic dentro da Microsoft acabou deixando o próprio Copilot CLI “esquecido”.

Em outras palavras, a Microsoft removeu o Claude Code não porque ele não funciona, mas porque ele funciona muito bem.

A data limite de 30 de junho não é coincidência — é o último dia do ano fiscal da Microsoft. Cortar uma ferramenta amplamente preferida pelos funcionários e substituí-la por um produto próprio, com o timing alinhado ao ponto fiscal — quantos aspectos são decisões de produto e quantos são considerações financeiras, todos sabem.

Claude Code

A Microsoft não é um caso isolado.

Há um mês, o CTO da Uber, Praveen Neppalli Naga, revelou ao The Information que o orçamento anual da empresa para ferramentas de programação de IA em 2026 foi esgotado nos primeiros quatro meses. Anteriormente, a Uber havia criado uma classificação interna, incentivando os funcionários a usarem mais IA por meio de competições — o resultado foi a quebra do orçamento.

Mais diretamente, Bryan Catanzaro, vice-presidente de aprendizado profundo da NVIDIA, disse em uma entrevista à Axios: “Para a minha equipe, o custo da computação é muito maior do que o custo dos funcionários.” Isso vem de um executivo de uma empresa de hardware — cujo produto principal é vender computação.

A Fortune juntou essas pistas e deu ao artigo um título muito Fortune: “O relatório da Microsoft expõe o verdadeiro problema de custo da IA — usar isso é mais caro do que manter funcionários”.

Se você ler apenas até este nível, a conclusão é simples: o vibe coding falhou, e a história da IA substituindo humanos pode ser encerrada.

Mas essa conclusão foi tirada cedo demais.

02 O modo Copilot já "bateu na parede"

Para explicar a retirada da Microsoft, primeiro é preciso entender o que é vibe coding.

Este termo foi proposto por Andrej Karpathy no início de 2025 — ele descreveu uma nova forma de programação: os desenvolvedores não escrevem mais código linha por linha, mas descrevem sua intenção em linguagem natural, permitindo que o LLM gere o código. Os desenvolvedores nem mesmo leem o código, apenas verificam o resultado — se funcionar, aceitam; se não funcionar, pedem ao AI para corrigir novamente.

Esta é a promessa de produtividade mais atraente da era da IA. Significa: um engenheiro que não sabe escrever Rust pode fazer a IA escrever Rust para ele; um gerente de produto pode fazer a IA criar um protótipo para ele; um designer pode fazer a IA gerar código funcional para ele. Os destinatários da liberação do Claude Code pela Microsoft em dezembro de 2025 — engenheiros, PMs e designers — são exatamente essas três categorias de pessoas. Não é coincidência; é a forma mais clássica de implementação do vibe coding.

Mas quando vibe coding é aplicado em grandes empresas, torna-se algo estruturalmente desconfortável.

Suponha que a Microsoft tenha um engenheiro com um salário anual de US$ 300.000. Após a Microsoft fornecer a ele o Claude Code, sua produtividade aumenta 20% — esse é o estado ideal do vibe coding. Mas, ao mesmo tempo, qual é o custo mensal dos tokens que ele consome: US$ 200, US$ 500 ou US$ 2.000? Esse número aumentará monotonicamente à medida que sua dependência da IA crescer.

Mais complicado ainda, ele não será demitido por “ter usado IA” — seu salário anual de 300 mil ainda está lá, seus benefícios ainda estão lá, e seu lugar de trabalho também ainda está lá.

Ou seja, a estrutura de custos total da Microsoft é “salários dos funcionários originais + novas contas de tokens”. Esta fórmula tem apenas uma direção — custos em disparada.

Claude Code

Mas o fato de “produtividade dos funcionários +20%” se refletir financeiramente como “receita +20%”? Não. Reflete-se como “receita mantida constante, mas com um novo item na estrutura de custos: uma conta de IA” — pois a maior parte da produtividade dos funcionários não corresponde diretamente a receitas adicionais; escrever mais rápido não significa que a empresa vende mais.

Essa é a verdadeira significação da frase de Catanzaro de que "o poder de computação é mais caro que os funcionários". Não significa que a IA seja burra, mas sim que, quando você coloca a IA no lugar dos funcionários antigos, você não consegue equilibrar as contas.

Essa lógica também tem suporte de dados.

Um relatório recente da Gartner prevê que, até 2030, o custo de inferência de modelos grandes com um trilhão de parâmetros cairá cerca de 90% em relação a 2025. Parece que a IA está ficando mais barata, mas a conclusão real da Gartner é que isso não tornará a conta total de IA das empresas mais barata. O analista sênior da Gartner, Will Sommer, disse: "Os CPOs não devem confundir a deflação de tokens de nível commodity com a democratização da capacidade de inferência de ponta."

A previsão do Goldman Sachs é mais direta: até 2030, a IA agente impulsionará o consumo de tokens em 24 vezes, atingindo 120 quadrilhões por mês. Preço por token caindo 90%, consumo aumentando 24 vezes — o resultado é que a conta total ainda sobe.

Jensen Huang tem uma versão ainda mais ousada. Há alguns meses, em público, ele disse que, no futuro, cada funcionário da NVIDIA trabalhará ao lado de 100 agentes de IA.

Soa muito bom. Mas se você for o CFO, o que você ouve? São 100 tokens sendo queimados, 24 horas por dia, sem parar.

O problema não é o AI ser muito caro. O problema é a própria suposição de "dar um AI como co-piloto a cada funcionário".

Esse posicionamento tem um nome popular no mundo da tecnologia — “modo copiloto” (copilot mode). Sua suposição central é: o ser humano continua no banco do motorista, enquanto a IA está no banco do passageiro oferecendo sugestões. Ela não substitui você, apenas o torna mais rápido.

Essa suposição é muito branda em termos textuais — “A IA não vai tirar seu emprego, a IA só vai te ajudar”. Mas financeiramente, seu significado implícito é: todos os salários permanecem os mesmos, mas há um custo adicional de token.

E os tokens não são uma taxa fixa, mas sim cobrados conforme o consumo. Quanto mais os funcionários usarem, mais a empresa pagará — exatamente a estrutura de custos que as empresas mais desejam evitar: variável, sem teto e que aumenta proporcionalmente à capacidade.

Quando a Microsoft lançou o Claude Code em dezembro de 2025, talvez não tivesse plenamente compreendido esse ponto. O objetivo original era permitir que os funcionários testassem e vissem em quanto a IA poderia aumentar a produtividade. Mas seis meses depois, os funcionários realmente se tornaram viciados; o Claude Code tornou-se extremamente popular dentro da Microsoft — resultando em contas de tokens muito superiores ao esperado, excedendo os retornos que a Microsoft poderia recuperar com essa popularidade.

A Microsoft retirou-se. Mas o que foi retirado não é a IA — é a estrutura de "funcionários no banco do motorista, IA no passageiro".

Este é um fracasso estrutural. Ele não desaparecerá porque o modelo seja mais barato, nem porque os funcionários sejam mais qualificados — ele se tornará mais grave à medida que os funcionários se tornarem mais proficientes em IA.

03 Queimar tokens, porque não queimar cabeças

Quase na mesma semana em que a Microsoft se retirou, Tom Blomfield apresentou uma perspectiva completamente diferente no batch talk da YC. Ele não discutiu "como usar a IA" — ele discutiu "como deveriam ser as empresas na era da IA".

Claude Code

A avaliação de Blomfield é direta: hoje, a maioria das empresas ainda tem uma estrutura tipo "legiões romanas" — informações são transmitidas gradativamente para cima, ordens são distribuídas gradativamente para baixo, e as pessoas são o núcleo da coordenação. Colocar IA nessa estrutura é como entregar armas de fogo aos legionários romanos — eles as usarão com mais intensidade, mas a tática não mudará.

Uma empresa verdadeiramente nativa de IA deveria ser de outro jeito.

Blomfield usou uma descrição muito específica: cada ação deve produzir um produto registrável e invocável, tornando tudo legível para a IA; a empresa deve ser projetada como um "ciclo de IA autossupervisionada", onde o sistema percebe o ambiente, toma decisões, invoca ferramentas, recebe feedback e se corrige.

Nesta empresa, há apenas dois papéis possíveis: um é o contribuidor individual — todos, independentemente do departamento, são builders e operators, levando protótipos às reuniões, não apenas ideias; o outro é o DRI (responsável direto) — cada resultado tem um responsável claro, “não se pode se esconder atrás da IA”.

Então Blomfield disse a frase clássica: "Se a sua fatura de API não doer, você não está queimando o suficiente."

Essa frase seria considerada uma piada no escritório do CFO da Microsoft; mas diante de um grupo de fundadores de startups na YC, ninguém a considera louca.

Why?

Outro sócio da YC, Diana Hu, deu a resposta na Startup School no início de maio. Ela disse uma frase: “O que maximiza não são os números de pessoas, mas o consumo de tokens.” Ela também tem uma versão mais direta: “Uma pessoa com ferramentas de IA equivale a uma grande equipe de engenheiros do passado.”

Observe a palavra-chave aqui: “igual a”. Não “equivalente a”, não “semelhante a” — é substituição.

Na turma P26 da YC de primavera de 2026, várias empresas já estão usando 5 ou 6 pessoas para fazer o que antes exigia 20 ou 30. Suas faturas de tokens são altas, mas suas faturas de pessoal são extremamente baixas — no total, estão lucrando.

Um caso mais agressivo é o Block. Esta empresa de tecnologia financeira, sob o comando de Jack Dorsey, recentemente demitiu 40% de seus funcionários. Não se trata de uma "redução de custos e aumento de eficiência" no sentido tradicional — o Block aumentou simultaneamente o investimento interno em ferramentas de IA, criando uma nova estrutura descrita por Diana Hu: IC + DRI + agente de IA.

Queimar tokens no contexto da YC não é uma despesa, é uma substituição. Ela não substitui despesas fora da IA, mas salários de funcionários. A conta fecha porque a empresa eliminou simultaneamente as posições que originalmente exigiam pagamentos de salário.

Essa é a razão fundamental pela qual a Microsoft e a YC viram a mesma coisa, mas deram respostas opostas — elas não estão usando o mesmo tipo de token. O token da Microsoft é para abastecer o passageiro ao lado do motorista original, enquanto o token da YC é substituir o motorista original.

04 Os verdadeiros ativos estão sendo redefinidos

Tom Blomfield também disse outra frase mais intrigante na conversa: "As pessoas são transitórias, os documentos de contexto é que são importantes."

Esta é uma avaliação a nível contábil.

Como é feita a demonstração financeira de uma empresa tradicional? À esquerda estão ativos fixos, contas a receber, goodwill e IP; à direita, passivos e patrimônio líquido. Os funcionários não aparecem na seção de ativos — funcionários são custos. Mas toda empresa sabe, internamente, que os funcionários são verdadeiramente ativos: os relacionamentos com clientes estão na cabeça dos vendedores, a intuição de negócio está na cabeça dos gerentes de produto e o know-how técnico está na cabeça dos engenheiros.

Esse tipo de "ativo" tem a característica de se mover. Quando um funcionário sai, o ativo vai embora.

E a empresa nativa de IA descrita por Blomfield está fazendo uma coisa: extrair todos esses ativos que antes existiam apenas na mente humana, transformando-os em "ativos de contexto" legíveis, chamáveis e iteráveis pela IA.

Qual é a forma concreta? É um documento de requisitos detalhado; é um documento de processo que registra cada decisão, cada correspondência por e-mail e cada discussão no Slack; são interfaces e APIs MCP abertas; são os artefatos gerados por cada ferramenta interna — tudo isso constitui uma nova camada de ativos para a empresa, que é herdável e não desaparece com a saída dos funcionários.

Nessa empresa, as pessoas acabam se tornando “variáveis” — podem ser integradas rapidamente e também deixadas rapidamente, pois o ativo principal da empresa não está na mente das pessoas, mas nos documentos.

Claude Code

Se essa estrutura se confirmar, significa algo mais do que um novo modelo organizacional — significa que o balanço patrimonial das empresas está sendo reescrito. Uma empresa nativa de IA com apenas seis pessoas e contas impressionantes de tokens pode parecer financeiramente insustentável, mas seus ativos reais podem ser maiores do que os de uma empresa tradicional com sessenta funcionários — apenas que os atuais princípios contábeis ainda não aprenderam a calcular esse tipo de ativo.

Em outras palavras, vibe coding não morreu. Ele simplesmente não pertence às empresas tradicionais.

No dia em que a Microsoft removeu o Claude Code, não foi um dia de fracasso da economia da IA — foi um dia em que uma postura de encaixar a IA em organizações antigas foi refutada por si mesma.

Naquela sala cheia de startups da YC, está surgindo outro modelo—elas são pequenas, consomem recursos, não têm “taxa de uso de IA por funcionário” em suas métricas KPI, e seus CFOs não entram em pânico com o aumento repentino das faturas de tokens—porque o que estão consumindo não é o “copiloto do funcionário”, mas sim o “substituto do funcionário”.

Nos próximos anos, todas as empresas médias que ainda estão pedindo aos funcionários para "usar mais IA" enfrentarão a mesma parede que a Microsoft enfrentou — faturas de token com aumento estrutural.

Mas a verdadeira razão para a colisão não é o AI ser muito caro — é que a organização ainda não mudou.

E a maioria absoluta das empresas provavelmente não mudará por enquanto.