Lançamento da API DeepSeek V4 com modelos Flash e Pro, redução de preços e expansão de contexto em 8x

KuCoinFlash

Data de lançamento: 24/04/2026, 04:03:20

Resumo

A API DeepSeek V4 lançou os modelos V4-Pro e V4-Flash em 24 de abril (UTC+8), com preços atualizados e contexto expandido. O V4-Flash substitui o V3.2 com custo de entrada 50% menor e custo de saída 33% menor. O comprimento do contexto aumentou de 128K para 1 milhão de tokens. O V4-Pro, um novo modelo de topo, é 8 vezes mais caro que o V3.2 no preço de saída. A DeepSeek espera que os preços caiam no segundo semestre com os nodes Ascend 950. Movimentos nos preços de criptomoedas e o sentimento do mercado, conforme refletido no índice de medo e ganância, podem influenciar a adoção desses novos modelos.

Notícia da ME, 24 de abril (UTC+8): De acordo com monitoramento da Beating, a API DeepSeek V4 já foi sincronizada com V4-Pro e V4-Flash, e o canal oficial do WeChat divulgou os preços e o planejamento de capacidade de processamento. O V4-Flash substitui diretamente o V3.2 (deepseek-chat), sem aumento de preço, mas com redução: a entrada com cache hit permanece inalterada (0,2 yuan por milhão de tokens), a entrada sem cache hit caiu de 2 yuan para 1 yuan (redução de 50%) e a saída caiu de 3 yuan para 2 yuan (redução de 33%). O contexto foi expandido de 128K para 1M, ou seja, você obtém 8 vezes mais contexto por um preço mais baixo. Os nomes dos dois modelos antigos, deepseek-chat e deepseek-reasoner, serão desativados em 24 de julho de 2026 e atualmente apontam para os modos não reasoning e reasoning do V4-Flash, respectivamente. O V4-Pro é uma nova categoria premium: entrada com cache hit a 1 yuan, sem cache hit a 12 yuan e saída a 24 yuan por milhão de tokens — o preço de saída é oito vezes maior que o do V3.2. A DeepSeek explicou na tabela de preços que, devido às limitações de capacidade de processamento de alto desempenho, o throughput atual do serviço Pro é muito limitado, e espera-se que, após a entrada em massa dos supernós Ascend 950 no segundo semestre, o preço do Pro seja reduzido significativamente. Ambos os modelos suportam modos reasoning e non-reasoning, com o modo reasoning permitindo a configuração do parâmetro reasoning_effort em dois níveis: high e max. A DeepSeek declarou no anúncio: “A partir de agora, 1M de contexto será o padrão em todos os serviços oficiais da DeepSeek.” (Fonte: BlockBeats)

Fonte:Mostrar original

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.