Uber e Microsoft destacam aumento dos custos dos tokens de IA e retornos decrescentes

Artigo escrito por Bao Yilong

Fonte: Wall Street Journal

A justificativa para os gastos em IA corporativa está sendo severamente testada, pois o consumo de tokens continua a aumentar, mas o valor comercial mensurável é difícil de encontrar.

Em 22 de maio, o diretor de operações da Uber, com capitalização de mercado superior a US$ 200 bilhões, Andrew Macdonald, declarou em um podcast que "ainda não existe essa linha" entre o crescimento do consumo de tokens e as melhorias reais do produto.

Macdonald apontou que as empresas estão enfrentando cada vez mais dificuldade para justificar os gastos contínuos em IA. Ele até cunhou um termo específico para o desperdício dentro das equipes de engenharia: "tokenmaxxing" (token maximization).

Em meados de maio, a Microsoft começou a reduzir as licenças internas do Claude Code, alegando que as faturas em Token eram insustentáveis.

A combinação desses dois eventos força o mercado a reconhecer uma variável anteriormente ignorada. A economia de tokens, ou seja, a viabilidade econômica por unidade de consumo de tokens em escala empresarial, passou de um tema marginal a um pilar central da discussão de investimento em IA.

Cinco conjuntos de dados, formando um novo quadro

Desde abril, uma série de dados foi divulgada, juntamente traçando um quadro alarmante.

Em abril deste ano, o chefe de tecnologia do Uber declarou publicamente que a empresa esgotou o orçamento anual do Claude Code em quatro meses.

Entre 5.000 engenheiros, a taxa de uso mensal varia entre 84% e 95%, com faturas mensais por pessoa variando de US$ 150 a US$ 2.000; o próprio CTO teria consumido tokens no valor de US$ 1.200 durante uma apresentação interna de duas horas.

Macdonald descreveu ficar "totalmente atônito" ao saber esse número.

Por parte da Microsoft, segundo a newsletter Notepad de Tom Warren, do The Verge, o Claude Code ganhou popularidade rápida entre os engenheiros internos da Microsoft, mas o modelo de cobrança baseado em tokens tornou insustentável a despesa em escala, levando a Microsoft a iniciar cortes nas licenças relacionadas.

O GitHub anunciou que, a partir de 1º de junho, todos os planos Copilot passarão de assinatura fixa para cobrança por uso.

O post oficial de discussão recebeu quase 900 votos negativos, pois alguns usuários calcularam que uma sessão de programação de agente consome normalmente entre 30 e 40 dólares, o que significa que um plano de 10 dólares por mês é esgotado em um único uso.

A plataforma de produtividade de desenvolvedores Entelligence.AI, após reunir dados de 2.444 empresas, descobriu:

Para cada dólar gasto em tokens de IA, apenas 18 centavos geraram valor real para os usuários.
44 centavos de dólar foram usados para corrigir bugs introduzidos pelo próprio AI; 27 centavos de dólar foram direcionados para retrabalho; 11 centavos de dólar foram consumidos pela fricção de revisão.

De acordo com o Índice de Despesas em Tokens de LLM da Silicon Data da Bloomberg, o preço dos tokens aumentou cerca de 65% desde o final de fevereiro deste ano, enquanto os preços de software de IA nos Estados Unidos subiram acumulativamente entre 20% e 37% no último ano.

Batalha entre compradores e vendedores: o mesmo fato, duas interpretações

Os mesmos dados, em diferentes quadros de análise, levam a conclusões totalmente distintas.

A perspectiva de bull argumenta que a confusão atual é apenas um período de dor durante uma transição bem-sucedida.

Segundo Jim Schneider do Goldman Sachs, em análise no início de maio, até 2030, a IA de agente impulsionará o consumo de tokens em 24 vezes, atingindo cerca de 120 quintilhões de tokens por mês, e as margens brutas dos grandes provedores de nuvem e modelos se tornarão positivas nos próximos 3 a 12 meses.

Rich Privorotsky do Goldman Sachs acredita que o primeiro trimestre de 2026 pode ser o pico do "token maximization" como KPI, com a indústria migrando de uma busca por consumo para uma métrica mais saudável: "custo por ação eficaz".

O estudo econômico do JPMorgan também descobriu que, no início de 2026, houve um aumento brusco no número de pacotes novos e atualizados do Python no PyPI, um padrão que não ocorreu quando o ChatGPT foi lançado em 2022, indicando que um verdadeiro aumento na produtividade está acontecendo.

Além disso, a atual relação preço/lucro do Mag 7 é de aproximadamente 20 vezes os lucros futuros, bem abaixo dos 52 vezes do pico da bolha tecnológica em 2000, dos 67 vezes do Japão em 1989 e dos 34 vezes da era das "Beautiful Fifty". Segundo os critérios históricos de bolhas, atualmente não se configura uma bolha.

A visão de baixa foi mais sistematicamente apresentada pelo analista de semicondutores do Goldman Sachs, Jim Covello, em relatório de abril.

Ele apontou que quase todo o valor na cadeia de suprimentos de IA flui para as empresas de semicondutores, um fenômeno sem precedentes na história e insustentável: as empresas de chips deveriam se beneficiar quando seus clientes lucram, mas neste ciclo, seu prosperar ocorre à custa do esgotamento de toda a cadeia de suprimentos a montante.

O lucro líquido da NVIDIA aumentou cerca de 20 vezes desde o lançamento do ChatGPT; os principais provedores de nuvem em grande escala já esgotaram seu fluxo de caixa operacional e passaram a contratar empréstimos — o volume de emissões de dívida relacionadas a data centers em 2025 deverá atingir cerca de US$ 182 bilhões, dobrando em relação a 2024.

Estudo do MIT Nanda mostra que 95% das empresas que investiram em IA generativa tiveram retorno zero. Essa desconexão pode persistir por algum tempo, mas não pode durar para sempre.

Preocupações com a estrutura de financiamento cíclico

A discussão também abordou um nível mais complexo: o ciclo financeiro entre provedores de nuvem em grande escala e laboratórios de IA.

De acordo com documentos de divulgação corporativa compilados pelo The Information, a OpenAI e a Anthropic juntas representam mais da metade dos aproximadamente US$ 2 trilhões em compromissos futuros de serviços em nuvem da Microsoft, Oracle, Google e Amazon. Especificamente:

Dos US$627 bilhões em pedidos acumulados de serviços em nuvem da Microsoft, US$280 bilhões estão vinculados à OpenAI;
Do pipeline de US$ 553 bilhões da Oracle, 54% (aproximadamente US$ 300 bilhões) são comprometidos pela OpenAI;
Dos 467,6 bilhões do Google, a Anthropic representa 43% (aproximadamente 200 bilhões de dólares);
A exposição correspondente da Amazon também atinge 51% do seu estoque de US$ 464 bilhões.

Essa estrutura de financiamento possui uma natureza cíclica interna. O investimento de US$ 13 bilhões da Microsoft na OpenAI é principalmente realizado na forma de créditos Azure, que a OpenAI utiliza para comprar capacidade de computação Azure, e a Microsoft, em seguida, reconhece esses valores como receita de nuvem.

O mesmo provedor de nuvem em grande escala é tanto investidor em laboratórios de IA quanto fornecedor de serviços que emite faturas de poder de computação.

Essa estrutura também se reflete nos dados de lucro. A Alphabet anunciou um lucro recorde de US$ 62,6 bilhões no primeiro trimestre, dos quais cerca de US$ 28,7 bilhões, quase metade, decorrem da valorização contábil das ações da Anthropic.

Dos US$30,3 bilhões de lucro do primeiro trimestre da Amazon, US$16,8 bilhões são ganhos não realizados antes dos impostos da Anthropic, enquanto seu fluxo de caixa livre caiu 95% para US$1,2 bilhão devido a despesas de capital em data centers de US$44,2 bilhões no mesmo período.

A sustentabilidade desse sistema depende da capacidade dos laboratórios de IA de obter financiamento externo contínuo para cumprir suas promessas de computação em nuvem, o que, por sua vez, depende da disposição contínua dos clientes corporativos de pagar contas de tokens cada vez mais altas.

Relata-se que a Anthropic atualmente tem um custo de até US$ 3 para cada dólar de receita. Assim que o ritmo de financiamento desacelerar, a credibilidade das previsões de receita em nuvem diminuirá, e os múltiplos de avaliação das grandes empresas de nuvem enfrentarão pressão para reavaliação.

Esta cadeia transmite em ambas as direções e também se romperá em ambas as direções.

This is not 1999, but the issue is real

A situação atual não constitui um cenário de bolha típico.

Em termos de múltiplos de avaliação, os sete gigantes da tecnologia atualmente estão em torno de 20 vezes o P/L futuro, bem abaixo dos 52 vezes no pico da bolha tecnológica de 2000, dos 67 vezes no mercado japonês de 1989 ou dos 34 vezes na era das "Beautiful Fifty".

A tecnologia de IA é real. Para o grupo de usuários intensivos, os dados de aumento de produtividade também são verificáveis. A OpenAI tem uma receita anual de cerca de 20 bilhões de dólares, e a Anthropic, cerca de 4,3 bilhões de dólares; ambas as laboratórios não desaparecerão por isso.

Hoje, o custo do Token (consumo de capacidade de processamento) tornou-se um fator determinante para o sucesso ou fracasso da IA, enquanto há seis meses, ninguém sequer discutia esse assunto.

Naquela época, todos se preocupavam apenas com “a tecnologia funciona?”. Agora, a resposta é clara: em determinados contextos e entre determinados grupos, a tecnologia realmente funciona.

Mas surge uma nova questão: os recursos economizados pelas empresas a jusante com a IA conseguem ser transmitidos rapidamente para cima, superando a janela de avaliação deixada pelo mercado financeiro para laboratórios de IA e gigantes de nuvem?

Quem acredita no AI acha que, à medida que a tecnologia continuar a amadurecer, o ROI das empresas se tornará positivo em 1 a 1,5 anos.

Os céticos acreditam que mais executivos, como McDonald, se queixarão publicamente sobre o baixo retorno sobre o investimento em IA e começarão a cortar orçamentos.

Ambos os cenários podem estar ocorrendo simultaneamente, e o resultado ainda não está decidido. A única coisa certa é que a mentira anterior de que “se o consumo de tokens estiver aumentando, significa que a transição para a IA foi bem-sucedida” foi desmascarada.

Alto consumo de tokens não equivale a valor comercial; essas bolhas acabarão sendo espremidas. A conta da IA já venceu, mas ainda é uma incógnita quem pagará por isso.