Autor original: David Lopez Mateos
Compilação original: Deep潮 TechFlow
Guia: A mídia gosta de resumir a oscilação dos preços da capacidade de processamento GPU em um único número, mas a realidade é que quatro provedores de índices no terminal Bloomberg apresentam cotações que diferem em mais de 2 dólares, com direções e ritmos distintos. O autor deste artigo é David Lopez Mateos, fundador da plataforma de negociação de capacidade de processamento GPU Compute Desk, que utiliza dados de negociação em primeira mão para desmontar a estrutura de precificação real dos H100 e B200, revelando um mercado primitivo sem padrão de referência, sem contratos padronizados e sem curva a termo — a capacidade de processamento está sendo acumulada e sublocada como apartamentos de aluguel de curto prazo.
Os títulos da mídia fazem parecer que os preços da capacidade de GPU estão disparando. Essa narrativa é confortável, perfeitamente encaixada no quadro macroeconômico de “oferta restrita + demanda por IA insaciável”, e sugere algo reconfortante: temos um mercado funcionando bem, com sinais de preços claros e legíveis.
Mas não temos. Essa narrativa é quase inteiramente baseada em um único índice, que sugere algo que não deveria ser sugerido: o mercado de locação de GPU já é eficiente o suficiente para ser representado por um único número como estado global.
A escassez de oferta é real, mas a forma como diferentes pessoas a sentem é totalmente diferente — depende de quem você é, onde está e quais contratos ou ativos de computação está negociando. Diante dessa falta de transparência, a reação natural do mercado não é uma descoberta de preço ordenada, mas sim acúmulo: bloquear horas de GPU que você talvez ainda não precise, porque não tem certeza se conseguirá comprá-las a qualquer preço no próximo mês. Onde há acúmulo e nenhuma referência transparente, surgem mercados secundários fragmentados. Na Compute Desk, já facilitamos que inquilinos aluguem seus clusters, assim como pessoas alugam apartamentos durante grandes eventos. Isso não é hipótese — está acontecendo.
O índice não converge
Em mercados de commodities maduros, índices construídos com diferentes metodologias tendem a convergir. O petróleo Brent e o WTI apresentam uma diferença de alguns dólares devido à localização geográfica e à qualidade do petróleo, mas movem-se na mesma direção (Figura 1). Essa convergência é um sinal de mercado eficiente.

Legenda: Comparação da evolução dos preços do petróleo Brent e WTI, com direção altamente alinhada
Atualmente, há três provedores de índices de precificação de GPU no terminal Bloomberg: Silicon Data, Ornn AI e Compute Desk. A SemiAnalysis acaba de lançar o quarto — um índice mensal de preços de contratos a prazo de um ano para H100, construído com base em dados de pesquisas de mais de 100 participantes do mercado. Silicon Data e Ornn publicam índices diários de locação de H100, enquanto Compute Desk agrega dados ao nível da arquitetura Hopper. A SemiAnalysis captura preços de contratos negociados, e não preços listados ou preços coletados por raspagem. As metodologias, frequências e perspectivas sobre o mesmo mercado são diferentes. Vistos em conjunto, os desacordos são evidentes (Figura 2).

Legenda: Comparação sobreposta dos quatro índices de GPU, com níveis de preço e tendências claramente divergentes
O aumento ocorre exatamente onde?
Usando os dados do Compute Desk, podemos decompor as variações de preço do H100 por tipo de fornecedor e estrutura de contrato, sobrepondo o índice SDH100RT da Silicon Data (Figura 3). Todos os indicadores mostram aumento de preço, mas os pontos de partida e as magnitudes variam significativamente entre os índices e os tipos de contrato.

Legenda: Evolução de preços do H100 dividida por tipo de contrato, sobreposta ao índice SDH100RT
Os dados da neocloud H100 da Compute Desk contam uma história mais específica do que o índice agregado. Os preços sob demanda permaneceram relativamente estáveis durante todo o inverno, em torno de US$ 3,00/hora, antes de subir abruptamente para US$ 3,50 em março. Os preços spot foram mais ruidosos e mais baixos, apresentando apenas uma leve tendência de alta em março. Já o SDH100RT da Silicon Data mostrou uma subida mais suave e constante, aumentando de US$ 2,00 para US$ 2,64 no mesmo período. Os dois índices permaneceram em níveis distintos e descreveram ritmos diferentes: a Compute Desk indica uma salto em março, enquanto a Silicon Data aponta uma subida gradual.
Os preços reservados para um ano permaneceram basicamente estáveis até fevereiro, depois subiram abruptamente de US$ 1,90 para US$ 2,64 até o final de março — não um ajuste progressivo, mas uma reprecificação súbita. Isso é mais semelhante a fornecedores ajustando coletivamente as taxas de contrato após o aperto do mercado sob demanda, em vez de ser impulsionado por demanda estrutural contínua.
A história de março do B200 foi ainda mais intensa (Figura 4). O índice sob demanda do Compute Desk subiu de US$ 5,70 para mais de US$ 8,00 em poucas semanas. O SDB200RT da Silicon Data subiu de US$ 4,40 para US$ 6,11 antes de recuar para US$ 5,47. Ambos os índices registraram essa movimentação, mas começaram com uma diferença superior a US$ 2, e apresentaram padrões distintos de alta e recuo. O B200 possui menos de cinco meses de dados, menos fornecedores e maior spread; os dois índices estão observando o mesmo evento por meio de lentes muito diferentes.

Legenda: Evolução dos preços sob demanda e reservados do B200, com dados do Compute Desk e Silicon Data sobrepostos
Problemas de infraestrutura, não apenas diferenças regionais
Os mercados de commodities apresentam diferencial de base (basis differential). O gás natural da Appaláquia é um caso clássico: grandes reservas estão localizadas acima de capacidade de transporte estruturalmente limitada, com a utilização do corredor Pensilvânia-Ohio frequentemente superando 100%, e novos projetos, como o Borealis Pipeline, só entrarão em operação no final da década de 2020.
O mercado de GPUs apresenta uma situação semelhante: uma GPU H100 na Virgínia e uma H100 em Frankfurt não são o mesmo bem econômico. Mas apenas a diferença geográfica não explica por que o desvio entre índices medidos no mesmo mercado é tão grande. O desalinhamento no mercado de GPUs é mais profundo do que o do gás natural da Appaláquia. O problema do gás natural é um único elo ausente: a capacidade de transporte de tubulações conectando oferta e demanda. A lacuna de infraestrutura no mercado de poder computacional existe em ambos os lados — oferta e demanda. A infraestrutura física — uma rede consistente, configuração previsível e disponibilidade previsível necessárias para distribuir confiavelmente o poder computacional — ainda não está madura e, às vezes, simplesmente não funciona. A infraestrutura financeira — contratos padronizados, benchmarks transparentes e mecanismos de arbitragem que conseguem comprimir os spreads apesar das diferenças físicas — também ainda não existe.
Os dados contam uma história. A experiência real de tentar adquirir capacidade de processamento no início de 2026 contou uma história ainda mais dolorosa. A capacidade sob demanda de todos os tipos de GPU já estava esgotada. Encontrar 64 H100 era difícil: o Compute Desk mostrava que 90% dos fornecedores tinham zero disponibilidade em seus clusters sob demanda, e o mercado reservado não estava muito melhor. Em um mercado bem funcionando, essa escassez já teria empurrado os preços para um novo ponto de equilíbrio. Mas isso não aconteceu. Isso indica que os próprios fornecedores também carecem de informações em tempo real sobre precificação para ajustar. Os preços estão subindo, mas muito devagar para esgotar o mercado. A lacuna entre os preços listados e a disposição real de pagamento está sendo preenchida por acúmulo, sublocação e transações informais em mercados secundários.
O que precisa ser alterado?
Atualmente, o mercado de poder de processamento GPU apresenta sete problemas principais:
Não há padrão de consenso. Múltiplos índices coexistem, com metodologias diferentes e conclusões contraditórias.
A narrativa agregada oculta a estrutura. Um número como "preço do H100" oculta as grandes diferenças entre tipos de fornecedores e prazos de contrato.
Falta de dados de nível de negociação. No mercado bilateral, o desvio entre o preço de oferta e o preço real de negociação é muito grande.
Não há padronização de contratos. A maioria dos aluguéis de GPU é negociada bilateralmente, com termos variados. Prazos de contrato mais curtos e padronizados melhorariam a liquidez e a descoberta de preços.
A qualidade da entrega não é garantida. A topologia de rede, o emparelhamento de CPU, a pilha de rede e as variações de tempo de execução são muito grandes. Os compradores precisam saber qual é a qualidade da capacidade de processamento que estão adquirindo antes de fazerem qualquer compromisso.
O contrato não possui liquidez. Se a demanda mudar durante o período de reserva, as opções são limitadas:要么 absorver os custos,要么 sublocar informalmente. O mercado precisa de infraestrutura para transferência ou revenda de capacidade de mineração comprometida, permitindo que a produção flua para quem mais precisa dela.
Não há curva a termo. Sem poder precificar a termo, não é possível fazer hedge. É por isso que os credores aplicam descontos de 40% a 50% sobre garantias de GPU, mantendo os custos de financiamento elevados.
Não é possível estabelecer um mercado funcional para a matéria-prima mais importante deste século apenas impulsionando uma única linha. Medição, padronização, estrutura de contratos, qualidade de entrega, liquidez — todos esses elementos devem avançar simultaneamente; antes disso, ninguém consegue realmente determinar o valor de uma hora de GPU.
