DeepSeek reduz permanentemente os preços da API em meio ao aumento dos custos de IA

Artigo | Canal Luo Chao

DeepSeek anuncia a "permanência" do desconto de 75% na API V4-Pro, válido globalmente.

Estrutura de preços final: o preço de entrada básico foi reduzido de US$ 1,74 por milhão de tokens para US$ 0,435 por milhão de tokens, e o preço de saída foi reduzido de US$ 3,48 por milhão de tokens para US$ 0,87 por milhão de tokens. Para acertos de cache de entrada em toda a linha de produtos API, a DeepSeek implementou um desconto ainda mais significativo: US$ 0,003625 por milhão de tokens, adotando totalmente o modelo de precificação de piso tipo Pinduoduo.

Liang Wenfeng

Redes sociais, incluindo X, logo viram uma onda de chamados: Liang Wenheng é o Bodhisattva cibernético, o Deus Feng e o Santo Liang do mundo da IA. A emoção não vem da própria barateza — o DeepSeek sempre foi chamado de “Pinduoduo da IA”, com serviço gratuito para consumidores finais e preços baratos para empresas; o mundo já estava acostumado com sua acessibilidade. Mas a dificuldade deste novo corte de preço reside no fato de que a IA em todo o mundo está aumentando de preço.

Relatos indicam que Liang Wenheng investirá pessoalmente até 20 bilhões de yuans, representando 40% do total do financiamento, na recorde rodada A em andamento pela DeepSeek. A maioria das empresas, ao levantar capital, prioriza fortalecer o fluxo de caixa e melhorar os resultados financeiros, mas Liang Wenheng não pretende atrair investidores com promessas comerciais; em vez disso, mantém o compromisso com o código aberto e a busca por AGI — e esta redução de preços está sendo realmente implementada. A última vez que alguém demonstrou coragem ao declarar que não queria lucrar foi a Pinduoduo: em 2024, seu cofundador afirmou claramente aos investidores em uma chamada telefônica: “A partir do Q3, nosso lucro diminuirá gradualmente e não se recuperará no curto prazo. A longo prazo, a redução da rentabilidade é inevitável.” A ação despencou.

Sam Altman fala constantemente sobre a democratização da IA, mas a empresa OpenAI está avançando rapidamente na direção oposta ao seu nome: CloseAI. Liang Wenheng, por outro lado, está ativamente tornando a IA acessível a todos e a todas as empresas. Mas Liang Wenheng é realmente um bodhisattva? Não. Ele é um empresário; a abertura e a acessibilidade são escolhas de modelo de negócio — algo raro hoje em dia e que se tornará ainda mais escasso no futuro.

Porque: a IA está ficando cada vez mais cara.

Esta semana, a Microsoft cancelou sua licença interna do Claude Code, pois o custo baseado em tokens se tornou insuportável. A Microsoft já investiu pesadamente na OpenAI e fornece serviços de nuvem Azure para a empresa A, possuindo recursos de nuvem que todas as empresas invejam, mas o custo dos tokens ainda dói. Não é coincidência que, em abril deste ano, o CTO da Uber relatou uma situação embaraçosa à diretoria: o orçamento de IA previsto para todo o ano de 2026 foi esgotado em apenas quatro meses; 95% dos engenheiros usam ferramentas de programação baseadas em IA mensalmente, e 70% dos commits de código são gerados por IA. As palavras exatas foram: “I’m back to the drawing board because the budget I thought I would need is blown away already.”

O orçamento de tokens das grandes empresas está sendo gasto muito mais rápido do que o esperado; embora haja a causa de funcionários da empresa gastando tokens descuidadamente, a verdadeira raiz da escassez de orçamento de tokens é o aumento do custo da IA. Os preços de software de IA nos Estados Unidos aumentaram entre 20% e 37% no último ano. As três grandes empresas — Anthropic, OpenAI e Google — aumentaram silenciosamente os preços reais da mesma saída de IA nos últimos seis meses.

Liang Wenfeng

(Foto: X)

Anteriormente, o som popular era: “Quanto mais amplamente a IA for aplicada em grande escala, maior será o nível de industrialização, menor será o custo e mais feliz as empresas ficarão”, mas foi ingênuo.

E essa tendência não se reverterá. Os preços são determinados pela oferta e demanda, e não pelo custo, mas a oferta e demanda de IA já se invertiram completamente em 2026. Antes, as grandes empresas precisavam convencer as pessoas a usarem IA, educar o mercado e promover a tecnologia; a IA sempre foi subsidiada. Quantos chás de Qwen você já bebeu? E agora? As pessoas estão cada vez mais buscando ativamente a IA — “assim que provam, não conseguem mais viver sem”. Programação com IA, documentos com IA, AIGC e até busca com IA estão se tornando cada vez mais comuns. A era dos subsídios para IA acabou.

Quanto mais pessoas usam, maior a demanda e mais escassos se tornam os recursos de token, fazendo com que a escassez de capacidade de processamento transborde da GPU para CPU, armazenamento e até largura de banda. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk e empresas nacionais como江波龙 e as "Duozhang" estão aproveitando junto com a NVIDIA. De onde vem o crescimento exponencial das receitas das gigantes de semicondutores em 2026? Certamente não vem do triângulo fechado de investimentos entre OpenAI, Oracle e Microsoft, certo? Isso ainda é só o começo da dor das empresas. Além disso, produtos de IA como ChatGPT, Claude, Gemini e DouBao, que enfatizam uma hierarquia rígida entre versões gratuitas e pagas, deixarão os usuários individuais cada vez mais divididos.

É como um serviço de transporte sob demanda: nos momentos de loucura, você pode pegar caronas de luxo de graça para ir e voltar do trabalho, com o capital pagando por você. Após estabelecer o hábito dos usuários, os subsídios acabam e os preços retornam ao normal — quem precisa pegar o metrô ainda precisa pegar o metrô. O mesmo acontece com a IA. Portanto, em um contexto em que todos os tokens de grandes setores estão subindo, o fato de o DeepSeek insistir em reduzir seus preços não é mais apenas uma demonstração de coragem individual de um “bodhisattva cibernético”, mas sim uma exibição de poder de precificação reverso: consigo ser tão barato, ainda funcionar normalmente e manter a qualidade sem cair.

Desde que Liang Wenheng esteja disposto, a DeepSeek não precisaria ser tão barata assim. Assim, as pessoas começaram a se preocupar: a DeepSeek se tornará o Linux da era da IA? Com enorme influência, mas sem gerar grandes lucros. A contribuição do Linux para a indústria de TI é muito maior do que a do Windows ou do Android (o próprio Android é baseado no kernel Linux), mas ele é de código aberto e não gerou empresas gigantes como Microsoft ou Google no aspecto comercial. Atualmente, a DeepSeek tem grande influência, mas sua capacidade comercial está muito abaixo das três grandes da Silicon Valley e nem consegue competir com as três empresas chinesas Kimi, MiniMax e Zhipu. A ordem de receita das quatro grandes de 2025: Zhipu (receita de 724 milhões de yuans em 2025) > MiniMax (receita aproximada de 560 milhões de yuans em 2025) > Moonshot AI (aproximadamente 200 milhões de yuans) > DeepSeek (desconhecida, mas ainda menor).

Liang Wenfeng ganha dinheiro com quantização de IA, pode investir 20 bilhões em DeepSeek, mas a história de "energia baseada em amor" não pode durar.

No modo de código aberto, outras pessoas também podem realizar distilação, implantação e treinamento secundário, fazendo com que a vantagem tecnológica da DeepSeek se torne cada vez mais fina. Por isso, você sempre vê notícias desse tipo de “batalha por rankings”: após a abertura do GLM-5.1 da Zhipu, ele superou todos os resultados globais no benchmark SWE-bench Pro; o MiMo-V2.5-Pro da Xiaomi alcançou o primeiro lugar entre os modelos de linguagem de código aberto globais... Um relatório conjunto do MIT e da Hugging Face mostra que, no último ano, os modelos de código aberto desenvolvidos na China representaram 17,1% do total de downloads globais, superando os 15,8% dos Estados Unidos e ocupando o primeiro lugar no mundo.

Não surpreende que cada vez mais vozes na Vale do Silício digam: é essencial ter uma versão americana do DeepSeek, não podemos ficar de braços cruzados enquanto a indústria de IA repete a história da Shein, Temu ou TikTok. “Se os Estados Unidos não tiverem um campeão open source surgindo, o mundo funcionará sob o controle de qualquer país que consiga produzir o modelo open source e o software open source mais poderoso, estável, barato, personalizável, escalável e adaptado às necessidades pessoais e comerciais.” Questões envolvendo a competição entre grandes potências muitas vezes parecem abstratas, mas a competição por trás delas é concreta e real.

Por trás do surgimento do DeepSeek, já havia uma narrativa de substituição autônoma. O suporte do V4 ao Ascend é motivo de grande entusiasmo; sob o impulso da capacidade de computação nacional, a competitividade de preço atual do DeepSeek é apenas um aperitivo. No relatório técnico, o DeepSeek afirma que, após a produção em massa dos supernós Ascend 950 no segundo semestre, o preço do V4-Pro ainda será reduzido significativamente — os melhores dias ainda estão por vir.

Além da vantagem de talentos avançados em IA, os profissionais de IA estão tão caros que atingiram níveis “luxuosos”, mas na China são relativamente mais baratos. O salário de dez milhões de yuans oferecido por Lei Jun para atrair Luo Fuli da DeepSeek virou notícia; no mesmo período, Zuckerberg precisou oferecer 1 bilhão de dólares para atrair talentos, incluindo aquisições por contratação de equipes (acqui-hire). Mas a diferença na qualidade do que é produzido por pessoas com salários de 1 bilhão de dólares em comparação com as que recebem salários de dez milhões de yuans claramente não é de 700 vezes. Essa disparidade nos salários dos profissionais de IA, na verdade, se transforma em uma diferença sistêmica no sistema de produção de tokens.

Uma maior competitividade também vem do sistema energético, que é o primeiro nível do bolo de cinco camadas de IA de Jensen Huang.

O limite da IA é o poder de processamento; o limite do poder de processamento é a energia elétrica. Em abril de 2026, a DeepSeek contratou engenheiros sênior de operação e gerentes sênior de entrega em seu data center em Wulanchabu, Inner Mongolia, o que indica que ela planeja construir uma "fábrica de tokens" no oeste, transferindo sua vantagem de custo do nível de software para o nível físico. A última vez que mencionei Wulanchabu em um artigo foi quando o Kuaishou construiu seu data center lá: próxima a usinas elétricas e com clima favorável para dissipação de calor. Além disso, o preço da energia verde no oeste da China é de aproximadamente 0,2 a 0,3 yuan por kWh, apenas 1/5 a 1/4 do preço na Europa e nos Estados Unidos.

Não é apenas a energia verde do oeste que é competitiva. Dados da Agência Internacional de Energia de 2025 mostram que a capacidade total instalada de geração de energia da China ultrapassou 2.300 GW, representando cerca de 22% do global, sendo a maior do mundo; os Estados Unidos têm cerca de 1.300 GW. Mais importante ainda, a China possui a estrutura elétrica mais completa do mundo: termelétrica, hidrelétrica, eólica, nuclear e fotovoltaica todas estão presentes. Os dados indicam que a tarifa industrial da China tem sido mantida historicamente entre 0,06 e 0,08 dólares/kWh, enquanto a tarifa industrial na Califórnia, EUA, já se aproxima de 0,18 dólares/kWh, e em algumas regiões da Alemanha supera 0,25 dólares/kWh, o que significa que, para treinar o mesmo cluster de dez mil GPUs, a China é naturalmente dezenas de pontos percentuais mais barata que a Europa e os EUA.

Nos custos operacionais dos grandes modelos de IA, o custo de energia representa entre 60% e 70% do custo total de operação. Não é apenas o modelo que consome energia, mas também o grande gasto com refrigeração. O próprio "loco da infraestrutura" já construiu centros de dados diretamente no fundo do mar, aproveitando a energia eólica marinha próxima e usando a circulação de água do mar para refrigeração gratuita. Além disso, há grandes iniciativas como "Transmissão de Energia do Leste para o Oeste" e "Cálculo do Leste para o Oeste", com forte capacidade de alocação regional de energia e poder computacional. Regiões como Guizhou, Inner Mongolia e Ningxia já são nós centrais do "Cálculo do Leste para o Oeste", e os caminhos para transferir centros de IA para o oeste já estão preparados.

Usar IA chinesa é, na essência, usar uma IA treinada com um sistema energético mais competitivo — uma IA mais econômica e mais acessível. Esta é uma das razões pelas quais as receitas no exterior da Kimi, Minimax e outras dispararam após o Ano Novo Chinês: não é apenas porque os algoritmos são mais fortes, mas porque têm um “bônus” de tarifa de energia.

A NVIDIA pode definir o preço da computação de alto desempenho, mas as empresas como DeepSeek estão assumindo o poder de precificação dos tokens. Você pode dizer que IA barata não é boa. A IA realmente é proporcional ao valor pago; o DeepSeek V4 apenas reduziu a lacuna entre modelos abertos e fechados ao menor nível histórico. A empresa reconhece oficialmente a diferença objetiva em relação a modelos de ponta como o GPT, e ainda não é multimodal — consegue reconhecer imagens, mas não gerá-las.

Mas isso não impediu a comunidade de se voltar para o DeepSeek. A razão é que a maioria dos cenários comerciais reais não exige chamar o modelo mais poderoso do mundo a cada vez. Consultoria, atendimento ao cliente, resumos, tradução, complementação de código, bancos de conhecimento corporativos e processos automatizados não exigem a maior inteligência, mas sim “apenas suficientemente bom + suficientemente barato + suficientemente estável”. Quando o custo de inferência do DeepSeek V4 é apenas cerca de 1% (Flash) a 11% (Pro) do custo do GPT-5.5, uma empresa pode chamar dezenas de vezes mais tokens com o mesmo orçamento, testar mais cadeias de prompts e iterar mais fluxos de trabalho de agentes, resultando finalmente em resultados potencialmente melhores — afinal, a IA é, por natureza, um jogo de “probabilidade”. Se for suficientemente barato, por que não usar algo que funcione razoavelmente bem para obter resultados?

Portanto, quanto mais caro for a IA, mais valiosa se torna a acessibilidade do DeepSeek, e mais valiosa se torna a empresa DeepSeek — Liang Wenheng e seus investidores entendem isso melhor do que ninguém.