Depois de usar IA, a empresa parece estar mais pobre. Quando

Depois de usar IA, a empresa parece estar mais pobre. Quando a IA surgiu, os executivos acreditaram que era a oportunidade de demitir e reduzir custos. Imaginavam que uma única IA substituiria três pessoas, trabalharia sem dormir, estaria sempre disponível, não precisaria de aumento salarial nem benefícios sociais, e poderia operar 24 horas por dia. Parecia perfeito. Na realidade, a IA realmente não procrastina e nunca trabalha horas extras — mas cada vez que faz mais alguma coisa, cobra mais. Hoje, muitas empresas já estão reclamando: “Não conseguimos mais arcar com os tokens.” A primeira reação de muitos é: “Isso é exagero? A IA não está ficando mais barata? Depois que o DeepSeek surgiu, não se dizia que os custos dos grandes modelos tinham caído?” Mas muitos ignoram um detalhe importante: os modelos ficaram mais baratos, mas as empresas os estão usando muito mais intensamente. De alguém usando ocasionalmente, passou-se para todos os funcionários usando, e depois para dezenas de agentes rodando 24 horas por dia nos bastidores. O resultado? Cada chamada individual ficou mais barata, mas a fatura mensal está ficando cada vez mais cara. Por exemplo, a Uber liberou o Claude Code para 5.000 engenheiros e, em poucos meses, quase esgotou todo o orçamento anual de IA. A Microsoft também começou a frear: restringiu o acesso interno ao Claude Code e deixou de permitir que engenheiros o utilizassem sem limites. Em resumo, acabou a fase em que “você podia usar como quisesse”. A Amazon foi ainda mais direta: removeu completamente o ranking interno de uso de IA. A razão é simples: descobriram que, ao transformar “quanto IA você usou” em métrica de desempenho, os funcionários passaram a gastar tokens freneticamente só para subir no ranking. Parece que todos estão abraçando a IA com entusiasmo — mas na verdade, muitas chamadas não geram valor algum, são feitas apenas “para usar”. Na MiHoYo, em um experimento com múltiplos agentes, dezenas de agentes se chamavam mutuamente, aguardavam uns aos outros e se confirmavam reciprocamente: você me pergunta, eu respondo, você confirma de novo. Ninguém concluía nada; a cadeia de chamadas só crescia. No final, uma única noite consumiu cerca de 2 milhões de yuans em tokens — enquanto o valor real gerado foi quase nulo. Diante disso, muitos podem se perguntar: o que é um token? Como pode uma empresa ser queimada assim? Na verdade, um token pode ser entendido como a “conta de luz” no mundo da IA. Você pergunta algo em um chat e a IA responde em segundos — parece gratuito. Mas nos bastidores corporativos, cada frase digitada, cada trecho gerado, cada chamada ao modelo, cada execução de ferramenta por um agente — até mesmo conversas entre IA e IA — consomem tokens. E o mais importante: o modelo de cobrança da IA é completamente diferente do software tradicional. Antes, ao comprar software, o custo era基本 fixo: quanto por conta, quanto por ano — você conseguia estimar com precisão no início do ano. A IA não. Ela cobra por uso — e esse uso aumenta conforme a complexidade dos negócios cresce. Um funcionário fazendo algumas perguntas ocasionais gera pouco custo. Mas quando toda a equipe passa a usá-la, os custos começam a subir. Quando se integram agentes que fazem a IA chamar outras IAs, a fatura pode saltar de milhares para centenas de milhares ou até milhões. E nos últimos dois anos, toda a sociedade incentivou o uso intensivo da IA: aumentar a penetração da IA, aumentar a frequência de uso, aumentar a automação. Algumas empresas até colocaram o consumo de tokens como métrica de avaliação. Na economia, existe uma lei clássica chamada Lei de Goodhart: quando um indicador se torna um objetivo, ele deixa de ser um bom indicador. No exterior até cunharam um termo específico: “Tokenmaxxing” — que pode ser entendido como “esgotar os tokens ao máximo”. Alguém faz a IA otimizar o mesmo trecho de código dezenas de vezes. Outro pede que a IA gere uma dúzia de versões diferentes de um relatório. Outros ainda dividem tarefas simples que poderiam ser resolvidas em poucos passos em uma rede complexa de agentes — só para parecer mais inteligente. A IA virou um ornamento vazio. Pequenos excessos ainda são suportáveis. Mas o que realmente leva os custos ao limite é o uso de sistemas multi-agentes. Teoricamente, esse sistema é perfeito: um agente planeja, outro executa, outro verifica e outro resume — como uma equipe digital colaborativa. Na prática, ele se torna uma reunião sem moderador. Você me pergunta, eu te pergunto; você espera por mim, eu espero por você; uma confirmação não basta — precisa de outra. Todos estão ativos, mas nada é concluído. Em sistemas multi-agentes, entre 30% e 60% dos tokens são consumidos nesses ciclos sem sentido. Em outras palavras: grande parte do dinheiro não se transforma em resultados — é queimado enquanto as IAs se “reúnem” entre si. Mais irônico ainda: esses agentes não estão preguiçosos — pelo contrário, estão excessivamente sérios. Seguem rigorosamente cada passo lógico: um agente chama o próximo; o próximo volta para confirmar o anterior; até que todo o sistema se enrosque em um loop infinito. É como se uma empresa tivesse vinte pessoas numa sala de reuniões discutindo da noite até o dia seguinte — todos falando, todos engajados — mas ninguém toma decisão. E a reunião cobra por segundo. O problema é que esse tipo de “reunião” é constantemente replicado, dividido e aninhado. À medida que escala, os custos explodem exponencialmente. Porque o custo da IA nunca é único — ele se amplifica à medida que a cadeia de chamadas cresce, e é quase imprevisível. Nesse ponto, as pessoas já não discutem mais “se a IA é boa ou não”, mas sim algo mais prático: será que isso vai explodir nossa fatura? Modelos nacionais como DeepSeek e DouBao estão sendo revisitados não por nostalgia — mas por uma frase prática: pelo mesmo trabalho, pode custar várias vezes menos. Em outras palavras: não use sempre o modelo mais caro. Tarefas simples vão para modelos baratos; as complexas usam os grandes. As empresas estão entendendo que a IA não é uma ferramenta onde “quanto mais usar, melhor”. É um sistema onde “quanto mais usar, mais dinheiro você gasta”. O mercado financeiro também mudou. Antes, avaliava-se empresas de IA pelo volume de chamadas, pelo crescimento acelerado e pela quantidade de tokens queimados. Agora só importa uma coisa: ROI. Você gastou tantos tokens — mas recuperou quanto dinheiro? Uma realidade dolorosa: aumento de eficiência não equivale a ganhar dinheiro. Se você escreve código duas vezes mais rápido — mas vende uma unidade a menos do produto — isso não é lucro. É apenas gastar dinheiro mais rápido. Mais absurdo ainda: isso não é um problema isolado de algumas empresas. Uma empresa gastou 500 milhões de dólares em um mês só no Claude. Houve casos em que esqueceram de definir limites — e os tokens dispararam sem controle. A Meta foi ainda mais longe: criou um ranking interno chamado “Claudeonomics”, para ver quem usava mais IA. O campeão consumiu 31,2 trilhões de tokens em um mês. Convertendo isso: em um mês, ela gastou o equivalente ao salário anual de dois engenheiros sêniores. Em resumo: enquanto os CEOs gritam “tudo para IA!”, os financeiros já começam a suar frio. Na verdade, o ponto não é não usar IA — mas parar de gastar tokens sem critério.As pessoas começaram a fazer uma pergunta mais realista: esses tokens, afinal, têm algum valor em dinheiro real? #AI #AIAgent @grok