DeepSeek busca US$ 300 milhões em financiamento amid mudança estratégica

DeepSeek está começando a entrar em contato com capital externo.

The Information citou quatro fontes informadas afirmando que a DeepSeek está buscando pelo menos 300 milhões de dólares em sua primeira rodada de financiamento externo, com uma avaliação mínima de 10 bilhões de dólares.

Se voltássemos no tempo dois anos, isso seria quase uma proposição inválida. Durante esse período, essa empresa era a existência mais contraintuitiva de toda a indústria chinesa de IA.

Quando todos estão buscando financiamento, expansão, contando histórias sobre ecossistemas e competindo por pontos de entrada, a DeepSeek está, ao contrário, realizando um encolhimento intencional: não se manifesta publicamente, não lança produtos com frequência, não participa das narrativas das grandes empresas e até mantém distância do capital.

Muitos investidores tentaram se aproximar e receberam feedback quase unânime: não há plano de financiamento.

Em uma indústria altamente impulsionada por capital, essa postura parece ir contra a lógica industrial. Mas é justamente por isso que o DeepSeek foi visto por um tempo como um caso atípico, uma equipe tentando validar, na era da IA, um caminho com menos recursos.

Então, nesse sinal de financiamento, o que realmente importa não é o valor nem a avaliação, mas o fato de que ele quebra uma premissa estratégica de dois anos: o DeepSeek não tenta mais se isolar fora do sistema.

I. Firewall do DeepSeek

A rejeição de Liang Wenfeng ao capital externo tem raízes profundas.

Por volta de 2022, a indústria de quantificação foi continuamente reprimida por políticas, e o volume sob gestão da Funghua caiu pela metade desde seu pico de centenas de bilhões. Com grandes quantidades de clusters GPU e dinheiro em caixa, Liang Wenheng chegou a considerar a possibilidade de utilizar sua capacidade de processamento por meio de investimentos ou parcerias com provedores de nuvem.

Ele contratou especificamente duas pessoas para investimentos estratégicos, analisou uma série de projetos de tecnologia — economia de baixa altitude, hardware inteligente, SaaS — mas acabou não investindo em nenhum.

Na época, o julgamento interno da DeepSeek era que, se algo podia ser feito fora, também podia ser feito por eles.

Em julho de 2023, a DeepSeek foi oficialmente fundada. Desde o primeiro dia, Liang Wenheng estabeleceu uma linha para a empresa: não aceitar financiamento externo, não diluir a propriedade e não ser aprisionado pelo cronograma comercial de ninguém.

O que ele quer construir é mais como uma instituição de pesquisa pura, perseguindo AGI, fazendo código aberto e deixando a tecnologia falar por si mesma.

A confiança é algo concreto.

Em 2019, ele gastou 200 milhões de yuans para desenvolver internamente a plataforma de treinamento de aprendizado profundo, Firefly I. Dois anos depois, investiu 1 bilhão de yuans na construção da Firefly II, adquirindo em grande escala as NVIDIA A100, transformando Huanfang em uma das poucas empresas domésticas com um cluster de dez mil GPUs.

Durante o período mais crítico da escassez de chips durante a pandemia, Qianfang já havia acumulado estoque antecipadamente. Em 2025, o rendimento anual da Qianfang foi de 56,6%, com receita superior a 5 bilhões de yuans.

A carteira de Liang Wenfeng é mais robusta do que a de quase todos os investidores de empresas de IA.

Ter dinheiro, ter cartão, ter pessoas. O dinheiro dos VC é, na verdade, uma carga — trazendo apostas, pressão de avaliação e perguntas constantes sobre quando realizar o lucro. Ele foi bem direto: os VC são apenas gestores do dinheiro dos LPs e precisam ganhar dinheiro, então simplesmente não conseguem se alinhar.

This path reached its peak in January 2025. R1 was released, with training costs of approximately $5.6 million, performing close to OpenAI’s top-tier system.

"Fazer um modelo de mesmo nível com um décimo do dinheiro" — essa história fez a indústria perceber uma coisa: a capacidade dos modelos de ponta não pode ser obtida apenas por meio de acumulação extrema de recursos.

Naquele momento, o significado do DeepSeek foi rapidamente ampliado. Ele não oferecia apenas um modelo, mas uma possibilidade: entrar na zona de competição principal mesmo sem recursos privilegiados.

O firewall não apenas se manteve, mas tornou-se parte da história.

Mas o problema da história é que ela precisa ser continuada constantemente.

Dois: surgiram rachaduras

A rachadura não apareceu de repente; ela começou a se desenvolver após o lançamento do R1, mas os sinais na época estavam dispersos.

As pessoas são as primeiras a se soltarem.

A equipe de modelos de topo tem uma característica comum: os membros principais têm um valor de mercado muito alto e, assim que o projeto entra em um período de pausa, essas pessoas se tornam alvo de todo o mercado.

O primeiro a ser notado foi Luo Fuli, desenvolvedora-chave da arquitetura V3, que se juntou à Xiaomi no final de 2025 para assumir a equipe do grande modelo MiMo. Aproximadamente no mesmo período, Wang Bingxuan, autor principal do primeiro modelo de linguagem grande, foi para a Tencent; Ruan Chong, pesquisador-chave na direção de multimodalidade, juntou-se à Yuanrong Qixing como cientista-chefe; e Wei Haoran, autor principal da série OCR, também deixou a empresa por volta do Ano Novo Chinês deste ano.

Em seguida, temos Guo Daya. Nascido em 1994, doutor pela Universidade Sun Yat-sen, passou apenas dois anos na DeepSeek, mas participou integralmente do desenvolvimento de quase todos os modelos marcantes, como V3, R1, Coder, Math e Prover. O algoritmo GRPO que ele propôs é a base técnica central do R1, com mais de 37.000 citações totais em seus artigos — praticamente sem rivais entre pesquisadores chineses de IA da mesma geração.

Há apenas dois dias, Guo Daya juntou-se ao ByteDance, com foco em agentes inteligentes. (Leitura complementar: Zhang Yiming, Xin Da Ya)

Cinco membros-chave de pesquisa e desenvolvimento deixaram a empresa em sequência em menos de um ano. Essa movimentação tem significado além da simples saída das pessoas; no desenvolvimento de modelos, a experiência é altamente dependente de caminhos estabelecidos, e a partida de membros-chave afeta diretamente a eficiência e o ritmo da próxima iteração.

Por que eles foram?

Nos círculos de recrutamento especializado, estima-se que as grandes empresas estejam oferecendo aos técnicos principais da DeepSeek salários de duas a três vezes seus salários anteriores. A equipe Seed da ByteDance introduziu, a partir de setembro de 2025, um programa especial de opções sobre ações, concedendo mensalmente opções no valor de 90.000 a 135.000 yuan, conforme o nível hierárquico, a preços inferiores ao preço interno de recompra, equivalendo a um desconto direto.

A filosofia de gestão de Liang Wenfeng é quase um fenômeno único na indústria de tecnologia da China: sem horas extras, sem ponto, sem KPIs. Os funcionários saem às seis ou sete da tarde e não precisam registrar a chegada pela manhã.

Ele acredita que o tempo de trabalho de alta qualidade que uma pessoa pode realizar por dia dificilmente excede seis a oito horas. Essa cultura funcionou bem quando a DeepSeek era uma pequena equipe: pessoas inteligentes recebiam liberdade suficiente e elas mesmas se dirigiam para os desafios mais difíceis.

Mas quando alguém do lado de fora bate à porta com um pacote de oito dígitos, a liberdade não é suficiente.

O que é ainda mais letal são as opções. O DeepSeek nunca levantou capital e não possui um ponto de referência de valoração de mercado. Você oferece uma promessa de ações aos membros-chave, mas eles não conseguem converter isso em dinheiro real. As opções das grandes empresas têm preço de exercício, mecanismos internos de recompra e expectativa de IPO. O público só sabe que o DeepSeek é muito valioso, mas ninguém consegue dizer exatamente quanto vale — e os funcionários não sabem de forma alguma.

A saída de Guo Daya pode ser mais significativa do que a diferença salarial aparente. Ele foi para o ByteDance trabalhar com agentes, e a DeepSeek ainda não possui nenhum produto de agente; na lançamento do R1, nem mesmo suportava chamada de função.

Quer ser um agente, mas a empresa em que trabalha não atua nessa área — esse desalinhamento não pode ser compensado com nenhum valor de dinheiro.

Também se afrouxou o ritmo do produto.

O próximo flagship V4 originalmente programado para ser lançado próximo ao Ano Novo Chinês foi adiado para fevereiro, depois para março, e agora a versão oficial indica final de abril. Pela informação pública, atrás do atraso há pelo menos três razões entrelaçadas.

O nível mais direto é que a própria rota tecnológica sofreu uma mudança qualitativa.

O que o V4 pretende realizar já não é um modelo básico para superar benchmarks; arquitetura MoE com trilhões de parâmetros, multimodalidade nativa, contexto de milhões de tokens e um novo mecanismo de memória condicional Engram — isso é um projeto sistêmico, e a complexidade do treinamento e validação subiu para um novo nível.

Uma pressão mais profunda vem da carga da identidade.

DeepSeek se baseia na história de alcançar o topo com um décimo do custo. Se o V4 traz apenas um pequeno aumento de desempenho, mas eleva os custos de inferência, a narrativa que sustenta sua avaliação e reputação começará a rachar. Em certa medida, um V4 pouco impressionante seria melhor não ser lançado.

Há ainda uma camada pouco discutida: a adaptação profunda dos chips nacionais. Múltiplas fontes revelaram no início de abril que o V4 operará integralmente sobre o chip Huawei Ascend 950PR, tornando-se potencialmente o primeiro modelo grande de ponta a rodar completamente sobre capacidade de processamento nacional. Seu valor estratégico é extremamente alto, mas isso, por si só, representa um projeto gigantesco independente que consome grande parte da largura de banda de desenvolvimento.

Até abril de 2026, o DeepSeek não teve atualizações de grande versão por 15 meses. Durante esse período, a OpenAI realizou quatro a cinco iterações, a Anthropic lançou sucessivamente o Claude 4.5/4.6/4.7, e concorrentes domésticos como Zhipu, Moonshot e ByteDance também avançaram rapidamente na camada de aplicação.

Todos estão acelerando, apenas o DeepSeek permanece silencioso.

Diferentemente de muitas equipes, a DeepSeek não expandiu rapidamente após o R1, não impulsionou a comercialização em larga escala nem realizou atualizações frequentes de versões.

Na época, muitos interpretaram esse ritmo como disciplina. Mas, olhando para trás hoje, ele se assemelha mais a uma escolha ativa de prolongar o máximo possível o estado de "laboratório".

Manter a contenção é essencialmente controlar o ritmo, mas quando o ambiente externo acelera globalmente, o ritmo já não depende mais inteiramente de você.

Três: A concorrência mudou a lógica

Se observarmos isoladamente a situação atual da DeepSeek, é fácil atribuí-la a problemas internos da empresa. Mas a variável mais importante vem do exterior: nos últimos 15 meses, o维度 da competição em toda a indústria sofreu uma grande migração.

Anteriormente, o núcleo da competição entre grandes modelos estava na arquitetura, nos métodos de treinamento e na otimização de engenharia. Após 2026, novos elementos passaram a dominar: a escala dos pools de computação, a densidade de talentos e a velocidade do feedback na camada de aplicação. Os três juntos determinam quão rápido a iteração pode ocorrer.

A estrutura de receita das principais empresas internacionais já indicou a direção.

A receita anual da Anthropic dobrou de US$ 9 bilhões para US$ 30 bilhões em quatro meses, com quase todo o aumento proveniente do agente de programação Claude Code. O Cursor, um editor de código, tem uma avaliação de US$ 60 bilhões. O GitHub Copilot atinge 20 milhões de desenvolvedores.

O dinheiro está fluindo para produtos que podem diretamente gerar código, ferramentas e aplicações.

Os concorrentes nacionais também estão rapidamente preenchendo a lacuna, com ByteDance, Alibaba e Tencent cada um lançando linhas de produtos de Coding e Agent; as APIs da Zhipu e da Moonshot foram sobrecarregadas durante a febre dos camarões no início do ano, exatamente por causa de sua aposta na direção de Coding.

É evidente que a capacidade do modelo pontual ainda é importante, mas já não é o único fator determinante. Recursos, organização e capacidade do sistema começam a se tornar variáveis-chave. As ações das principais empresas chinesas nos últimos anos seguiram caminhos diferentes, mas com direção consistente: integrar a capacidade do modelo em sistemas maiores.

DeepSeek possui a maior popularidade da comunidade aberta global, com 170 mil estrelas no GitHub, 26 mil contas empresariais e 5,7 bilhões de chamadas de API por mês. Mas não possui seu próprio IDE, nem ferramentas de Coding, nem produtos Agent, nem aplicações verticais diretamente pagas por usuários finais.

Liang Wenfeng sempre acreditou que o modelo é a base de tudo.

A direção dos últimos artigos assinados por ele — mecanismo de memória condicional e otimização de hiperconexões no Transformer — indica que o DeepSeek ainda se concentra em resolver problemas fundamentais. Essa dedicação foi comprovada na era R1, ao alcançar o máximo de capacidade básica com o menor custo e número de pessoas, deixando o resto para o ecossistema de código aberto.

Mas quando a competição se expande da capacidade do modelo básico para uma comparação simultânea de capacidade, produto e ecossistema, ter apenas o motor, sem o veículo completo, não é suficiente para colocá-lo em movimento.

Na noite de 29 de março, o DeepSeek sofreu a interrupção de serviço mais longa desde seu lançamento, durando mais de 7 horas e afetando centenas de milhões de usuários. A empresa não explicou a causa. Durante a interrupção, o tráfego dos concorrentes aumentou significativamente, e alguns clientes corporativos começaram a considerar estratégias de redundância multiplataforma.

Um único outage não matará uma empresa, mas traz à tona um fato: quando os usuários aumentam de milhões para bilhões, o investimento em infraestrutura não pode ser compensado apenas por otimizações de eficiência.

Os lucros da幻方 são suficientes, mas não são confortáveis.

Quatro, o que comprar com 300 milhões de dólares?

Uma diluição de menos de 3% em relação a uma avaliação de US$10 bilhões. Em comparação com gigantes como Anthropic e OpenAI, esse número parece extremamente contido.

O que Liang Wenfeng realmente deseja comprar pode não estar no balanço patrimonial.

Primeiro, as opções finalmente têm um ponto de referência. Uma avaliação de 10 bilhões de dólares, uma vez confirmada, transforma as ações da equipe central em dinheiro real. Para uma equipe cujos membros estão sendo constantemente recrutados por grandes empresas, esse sinal é mais eficaz do que qualquer plano de aumento salarial; nessa fase, impedir a fuga de talentos é crucial.

Em segundo lugar, este é o fundo de seguro da V4.

O pleno ajuste do Huawei Ascend consome recursos por si só, enquanto a mídia relata que o DeepSeek também está usando os mais recentes chips Blackwell da NVIDIA para treinar o próximo modelo, e esses chips enfrentam incertezas na aquisição devido a restrições de exportação. A execução paralela de duas linhas de hardware duplica o consumo de capital.

O nível mais sutil é que este é um ingresso para o segundo tempo.

A competição em IA já entrou na fase de impulso quadripartido: modelos, produtos, ecossistemas e capital. Você pode ter o melhor motor do mundo, mas, sem apoio financeiro e ecossistema de produtos, acabará sendo apenas um fornecedor avançado na cadeia de valor, observando outros lucrarem com seus modelos.

Do ponto de vista do desenvolvimento do V4, Liang Wenfeng provavelmente já percebeu isso. Múltiplas fontes indicam que o planejamento do V4 inclui claramente avanços significativos em busca por IA, memória de longo prazo e capacidades de codificação — todas habilidades fundamentais para a era de Agentes.

DeepSeek está em recuperação. O financiamento é para garantir que esta disciplina possa ser concluída a tempo.

Fora do layout:

É fácil para o público externo interpretar esta mudança como uma concessão. Mas, sob uma perspectiva diferente, ela se aproxima mais de uma evolução de um estado experimental para um estado industrial.

O custo da indústria de IA subiu drasticamente, e a inflação de talentos ultrapassou todas as expectativas. Tornou-se cada vez mais inviável sustentar um superunicórnio com base apenas em estilo pessoal e uma única fonte de lucro.

As escolhas passadas de Liang Wenfeng tinham sua lógica: controlar a escala, evitar a comercialização precoce e manter a pureza da pesquisa e desenvolvimento. Essas escolhas, em estágios específicos, tiveram um grande impulso, mas o ritmo da indústria acabará por impor restrições a todos.

300 milhões de dólares, foi a primeira vez que Liang Wenfeng reconheceu publicamente isso.

Este artigo é do número oficial do WeChat "Fora da Página", autor: Pintar