Os preços do modelo chinês de IA caem, ampliando a diferença de custo com concorrentes dos EUA

icon币界网
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
Os preços dos modelos de IA chineses caíram, com a DeepSeek e a Xiaomi reduzindo os custos da API, enquanto empresas norte-americanas como a OpenAI aumentam as taxas. A DeepSeek agora cobra US$ 0,435 por milhão de tokens de entrada para o V4-Pro e US$ 0,87 para saída, enquanto a Xiaomi reduziu o preço de entrada com acerto de cache do MiMo-V2.5 Pro para US$ 0,0036 por milhão de tokens — alguns projetos tiveram uma redução de 99%. Otimizações em caching e frameworks de inferência reduziram os custos de armazenamento e processamento em 80%. A OpenAI aumentou o preço de saída do GPT-5.5 para US$ 30 por milhão de tokens, o dobro da versão anterior. Espera-se que a diferença de custo se amplie para 15 a 30 vezes até o Q2 de 2026, uma mudança que pode impactar altcoins a serem observadas à medida que o índice de medo e ganância reage às mudanças no sentimento do mercado.
Relatório do CoinWorld:

A mídia estrangeira relata que fornecedores chineses de modelos avançados reduziram recentemente ainda mais os preços das APIs; a DeepSeek e a Xiaomi anunciaram novos esquemas de precificação, enquanto os novos modelos dos principais laboratórios norte-americanos estão adotando preços mais altos. Isso ampliou ainda mais a diferença nos custos de inferência entre os modelos avançados da China e dos EUA.

Para clientes corporativos, o preço do modelo é principalmente refletido nos custos da API cobrados por token. Após a integração da aplicação com o modelo, entradas, saídas e acertos de cache geram custos; portanto, alterações no preço unitário afetam diretamente a viabilidade comercial do produto de IA.

DeepSeek e Xiaomi reduzem os preços simultaneamente

DeepSeek transformou o desconto de 75% para o V4-Pro em preço permanente em 22 de maio. Após o ajuste, o preço de entrada para esse modelo é de US$ 0,435 por milhão de tokens e o preço de saída é de US$ 0,87.

Xiaomi reduziu os preços da API MiMo-V2.5 em 26 de maio, com o preço de entrada para a versão Pro caindo para US$ 0,0036 por milhão de tokens, com reduções máximas de até 99% em alguns projetos. Com o novo plano da Xiaomi, a quantidade de tokens obtida pelo mesmo preço aumentou de 5 a 8 vezes.

Por trás da redução de preços está a otimização do raciocínio

O artigo afirma que este corte de preços não é apenas um movimento de marketing. Luo Fuli, líder da equipe MiMo da Xiaomi e ex-desenvolvedor-chave da DeepSeek, afirmou que as principais economias vêm da otimização do cache e do framework de inferência. O sistema pode reutilizar mais informações já processadas, reduzindo cálculos repetitivos e, assim, diminuindo os custos de armazenamento e inferência.

Segundo suas afirmações, as otimizações relacionadas aumentaram significativamente a capacidade de processamento de tokens em cache, reduzindo os custos totais de armazenamento e processamento em cerca de 80%. Com os novos preços da API, o mecanismo de inferência em ambiente de produção ainda pode atingir aproximadamente o ponto de equilíbrio mesmo operando quase na plena capacidade.

A abordagem do DeepSeek consiste em comprimir o custo computacional do contexto por meio da arquitetura do modelo. O artigo menciona que o V4 utiliza dois tipos de mecanismos de atenção intercalados, reduzindo significativamente o tamanho do cache KV e o custo de inferência por token em cenários de contexto longo. Com um contexto de um milhão de tokens, o cache KV do V4-Pro é apenas cerca de 10% do da geração anterior, e o custo de inferência por token é aproximadamente 27% do da geração anterior.

O preço do modelo americano segue a direção oposta

O artigo aponta que os principais modelos dos EUA recentemente não seguiram a tendência de redução de preços. O GPT-5.5 lançado pela OpenAI no final de abril aumentou o preço de saída para 30 dólares por milhão de tokens, cerca de duas vezes o valor da geração anterior. O preço do Claude Opus 4.7 da Anthropic permanece inalterado, mas, devido à atualização do tokenizer, o mesmo texto pode gerar mais tokens, podendo aumentar a fatura em até cerca de 35%.

Como comparação, o DeepSeek V4-Pro obteve 80,6% no benchmark de código SWE-Verified, próximo aos 80,8% do Claude Opus 4.6, mas com uma diferença de preço de saída de dezenas de vezes. O Xiaomi MiMo-V2.5-Pro, após a última revisão de preços, também alcançou o mesmo preço de entrada e saída do DeepSeek V4-Pro.

O artigo também menciona que outras empresas chinesas de modelos, como MiniMax, Moonshot AI e Z.AI, também mantêm preços baixos. Conforme comparado no artigo, no segundo trimestre de 2026, a diferença de preço entre modelos avançados da China e dos Estados Unidos situa-se aproximadamente entre 15 e 30 vezes; se os descontos por cache forem incluídos, essa diferença aumentará ainda mais.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.