A natureza assinatura da IA transforma o custo imprevisível da capacidade de processamento em uma estrutura de receita previsível, e esta será a questão central que o mercado repetidamente colocará às empresas de IA.
Autor do artigo, fonte: Wu Duidui
A IA nacional finalmente chegou a este ponto: não se pode mais falar apenas em usuários, precisa-se falar em lucro.
A fase de aquisição gratuita terminou, e as aplicações de IA começam a entrar na fase de "estratificação de custos + estratificação de usuários + validação comercial".
Recentemente, a página do豆包 na App Store apresentou informações de assinatura paga: além da versão básica gratuita, pode haver versão padrão por 68 yuan/mês, versão aprimorada por 200 yuan/mês e versão profissional por 500 yuan/mês, com taxa anual máxima de 5.088 yuan.
A resposta do DouBao é que o serviço gratuito será mantido, e as opções de serviço premium ainda estão em teste; os benefícios relacionados ainda não foram exibidos oficialmente no produto.
This matter can be viewed from several perspectives.
Isso está relacionado ao custo, especialmente ao "custo do usuário intensivo".
O problema mais complicado com esse tipo de produto é que quanto mais os usuários o utilizam, maior se torna o custo para a plataforma.
Um usuário comum fazendo algumas perguntas ocasionais pode ter um custo controlável.
Mas se o usuário começar a fazer essas coisas:
Escrever artigos longos, gerar apresentações em PowerPoint, realizar análise de dados, pesquisas aprofundadas, geração de imagens, geração de vídeos, conversas de voz em tempo real e execução de tarefas em múltiplos passos por Agentes.
Então não é nem mesmo o mesmo nível de custo.
Além da conversa, as principais funcionalidades da versão Mac do Doubao incluem "busca, edição de imagens, redação, tradução, PPT e análise de dados", com ênfase em fluxos de trabalho integrados para geração de imagens e vídeos, pesquisa aprofundada, atas de reuniões e processamento de documentos e planilhas. Essas funcionalidades, em essência, consomem mais tokens, mais poder de inferência e mais capacidade de processamento multimodal do que uma simples conversa.
Então, o fato de o DouBao cobrar é muito provavelmente não porque "está perdendo dinheiro com conversas normais", mas sim porque:
Capacidades de alto valor e usuários intensivos não podem mais ser fornecidas gratuitamente sem limites.
A versão gratuita pode continuar existindo como ponto de entrada, para ativação diária e construção da percepção da marca; mas as funcionalidades que consomem mais recursos devem ser estratificadas por meio de assinaturas, limites, prioridades e versão profissional.
O desafio da comercialização da IA é “receita fixa, mas custo variável”
Há uma contradição natural na assinatura:
O valor pago pelo usuário mensalmente é fixo, mas o número de tokens consumidos pelo usuário não é fixo.
Isso é diferente da Netflix, Tencent Video e iQIYI. Em plataformas de vídeo, após a produção de uma série, o custo marginal é relativamente limitado, pois os usuários podem assistir várias vezes. Com IA, cada conversa aprofundada, cada geração de vídeo e cada análise de contexto longo exigem o uso recorrente de recursos de inferência.
Os modelos de software tradicional e o modelo da Netflix são mais parecidos com:
Desenvolver uma vez → Copiar infinitas vezes → Custo marginal de vender uma unidade adicional próximo de zero
Mas o serviço de grandes modelos é mais parecido com:
Modelo de pesquisa e desenvolvimento uma vez → Cada chamada exige poder de processamento → Quanto mais usuários e mais profundamente forem utilizados, maior o custo de inferência.
As APIs da OpenAI, Azure OpenAI, entre outras, são cobradas por token, o que essencialmente demonstra isso: tokens de entrada, tokens de saída, contextos longos e cache de entrada têm preços diferentes, e os tokens de saída geralmente são significativamente mais caros.
Na página de preços oficial da OpenAI, o GPT-5.5 para contexto curto é de US$ 2,5 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, enquanto a entrada em cache é muito mais barata.
Isso não é um modelo econômico similar ao de vender Office, vender Photoshop ou vender sistemas operacionais.
O próprio火山引擎 da ByteDance também apresenta lógica semelhante: o preço do modelo Doubao para desenvolvedores é cobrado por milhão de tokens, por exemplo, o Doubao-Seed-2.0-pro é exibido como a partir de 3,2 yuan por milhão de tokens de entrada e a partir de 16 yuan por milhão de tokens de saída.
Isso revela um problema fundamental:
Os produtos de IA parecem ser assinaturas de membro, mas o back-end é cobrado por consumo. No entanto, eles não são exatamente iguais a um restaurante.
Uma forma mais precisa de dizer seria:
A IA é uma mistura de "empresa de software + empresa de nuvem + empresa industrial intensiva em energia".
Se um usuário pagar 68 yuan por mês, mas gerar freneticamente PPTs, vídeos e relatórios longos, os custos podem consumir a maior parte da receita.
Se um usuário paga 500 yuan por mês, mas o utiliza principalmente para trabalhos de alto valor com consumo controlado, é um bom negócio.
Então, a assinatura de IA essencialmente está fazendo uma coisa:
Transforme o custo de poder de computação incontrolável em uma estrutura de receita previsível.
Mudança da competição por escala de usuários para a competição por ARPU
Anteriormente, a competição em aplicações de IA no país era, em grande parte, uma disputa gratuita por usuários.
Por que o DouBao conseguiu se tornar tão grande? Além de ter vantagens no produto, isso se deve também ao tráfego da ByteDance, à forte capacidade de produto e ao baixo limiar gratuito. O DouBao é o aplicativo de chat AI mais utilizado na China; dados da QuestMobile mostram que seus usuários ativos semanais são de aproximadamente 155 milhões, enquanto o DeepSeek tem cerca de 81,6 milhões. Ao mesmo tempo, o Alibaba também impulsionou o crescimento de usuários do Qwen por meio de subsídios substanciais.
Mas o modo gratuito tem um problema:
Quanto maior o número de usuários, mais real se torna a pressão sobre os custos.
Especialmente na China, os produtos de IA ainda estão em uma guerra de preços. O DeepSeek reduziu drasticamente a expectativa de custo do modelo, e a Alibaba, ByteDance, Tencent e Baidu não querem perder sua entrada. Assim, a IA para o consumidor容易陷入一种尴尬:
Os usuários acham que a IA deveria ser gratuita; a plataforma sabe que a IA não pode ser infinitamente gratuita; os investidores querem ver crescimento; a empresa internamente deseja ver um ciclo comercial fechado.
O DouBao lançou uma versão paga, o que significa que deseja testar uma questão:
Os usuários na China realmente estão dispostos a pagar por fluxos de trabalho de IA?
Não pague por “bate-papo”, pague por “economizar meu tempo, fazer apresentações, escrever relatórios, fazer pesquisas, processar dados e gerar vídeos”.
Essa diferença é crucial.
Os usuários têm dificuldade em pagar 500 yuan por mês por “você me acompanha para conversar”.
Mas se ele realmente puder ajudar profissionais de conteúdo, vendedores, professores, estudantes, operadores e consultores a economizar 1 a 2 horas por dia, a aceitação de 68 yuan, 200 yuan ou 500 yuan será completamente diferente.
Isso também indica que a versão gratuita da IA será mantida, mas se tornará cada vez mais "limitada".
Future domestic AI-native applications will likely not use a one-size-fits-all pricing model, but rather a four-layer structure:
Nível 1: Versão gratuita
Para aquisição de clientes, estabelecimento de hábitos de uso e manutenção de participação de mercado. Conversas normais, perguntas e respostas básicas e buscas leves continuarão gratuitas.
Camada 2: Membro de baixo custo
Para usuários de alta frequência comuns, como limites mais altos, velocidades mais rápidas, menos espera e modelos melhores.
Nível 3: Versão Profissional
Vendendo PPT, análise de dados, pesquisas aprofundadas, processamento de documentos, código e contexto longo para criadores de conteúdo, profissionais, estudantes, programadores e pesquisadores.
Quarto nível: Serviços empresariais/API/Agent
Pagamento por uso ou plano + cobrança por excedente. Aqui é onde realmente se concretiza o modelo de negócios.
As três faixas de 68, 200 e 500 atualmente divulgadas pelo DouBao são, em essência, uma tentativa de testar essa camada.
A versão gratuita resolve o “escopo de usuários”; a versão padrão resolve o “pagamento leve”; as versões aumentada e profissional resolvem a “recuperação de custos para usuários intensivos”.
ChatGPT, Claude, Gemini, Kimi, Tongyi, Zhipu e DouBao já estão ou em breve estarão caminhando em direção a uma estrutura semelhante. A diferença está apenas em: qual tem a versão gratuita mais forte, qual oferece os benefícios pagos mais perceptíveis e qual controla melhor os custos.
Por que a assinatura de IA é mais difícil do que o SaaS tradicional?
Para cada usuário adicional, cada conversa adicional, cada resumo de texto longo adicional e cada tarefa adicional executada pelo agente, são consumidos mais GPU, energia, memória de vídeo, largura de banda, armazenamento e operação e manutenção de engenharia.
Então, o problema mais central das empresas de aplicativos de IA não é:
Há usuários?
mas:
Quanto mais usuários, mais se ganha ou mais se gasta?
Isso é muito diferente do modelo tradicional de SaaS. No SaaS tradicional, uma vez que o sistema está montado, a margem bruta de novos clientes geralmente é alta; mas, para produtos de IA, se os usuários os usarem intensamente, isso pode acabar gerando custos de inferência ainda maiores. A preocupação atual do mercado sobre o retorno sobre o investimento em IA das grandes empresas de tecnologia é, essencialmente, esse mesmo problema. Empresas como Alphabet, Microsoft, Meta e Amazon fizeram investimentos massivos em IA este ano, e os investidores estão começando a se concentrar mais em quando esses gastos com IA trarão retornos suficientes.
Mas uma assinatura de IA não pode ser simplesmente comparada a um restaurante, pois é difícil para um restaurante reduzir o custo de “uma tigela de macarrão” em 80% por ano.
Mas a IA pode.
Porque o custo de inferência do modelo será continuamente reduzido por várias coisas:
Primeiro, os chips ficam mais potentes. Segundo, os modelos ficam menores, com distilação, quantização e roteamento MoE mais refinado. Terceiro, cache, loteamento e reutilização de contexto reduzem o custo de cálculos repetidos. Quarto, muitas tarefas não precisam do modelo mais poderoso e podem ser concluídas com modelos menores. Quinto, as empresas passarão de “acumular tokens cegamente” para “consumir menos tokens por resultado de negócio”.
Então, o custo marginal da IA não é 0, mas também não é um custo fixo de ingredientes.
É mais como a nuvem computacional nos estágios iniciais: no começo era caro, mas a escala, juntamente com a otimização de hardware e software, continuará reduzindo os custos.
É por isso que a entrada em cache é muito mais barata do que a entrada normal na estrutura de preços da OpenAI. A existência do mecanismo de cache indica que os provedores de IA estão se esforçando para transformar cálculos repetitivos em etapas mais baratas, semelhantes a software.
Isso leva as empresas de IA a precisarem responder simultaneamente a três perguntas:
Primeiro, quanto o usuário está disposto a pagar? Isso é a receita.
Em segundo lugar, quantos tokens os usuários consomem por mês? Este é o lado dos custos.
Terceiro, a taxa de redução do custo do modelo consegue ser mais rápida do que o crescimento do uso? Essa é a questão da margem de lucro.
Se a resposta for:
O usuário está disposto a pagar 200 yuan, mas tem um custo mensal de 150 yuan, então esse negócio é bem mediano.
Se a resposta for: o usuário está disposto a pagar 200 yuan; o custo é apenas de 20 yuan e pode ser reduzido para 10 yuan com a otimização do modelo.
As aplicações de IA estão novamente se aproximando de um bom negócio de software.
Então, o verdadeiro indicador-chave do modelo de negócios de IA não é o DAU, nem o número de downloads, mas:
Receita por usuário pago / Custo de inferência por usuário pago.
Ou seja, o modelo econômico unitário versão AI.
Isso, por sua vez, afetará o mercado de IA
Em relação ao mercado de ações, isso é realmente importante.
O mercado está negociando IA agora; a primeira fase observa:
A demanda por poder de mineração irá explodir?
Então, NVIDIA, TSMC, Broadcom, armazenamento, equipamentos elétricos e data centers subiram.
Na segunda fase, o mercado perguntará:
Existem usuários para aplicativos de IA?
Portanto, o tamanho da base de usuários do ChatGPT, DouBao, Kimi, Qwen, Copilot e Gemini será observado.
Na terceira fase, que é a fase mais crítica a seguir, o mercado perguntará:
Esses usuários podem pagar? Após pagar, eles conseguem ganhar dinheiro?
O fato de que DouBao está cobrando é, na verdade, o início da terceira fase.
Se os sinais forem vistos no futuro, o mercado de IA estará mais saudável:
A taxa de conversão paga está boa; os usuários não estão deixando a plataforma em massa devido à cobrança; há pessoas dispostas a pagar pelo plano profissional de alto custo; os clientes corporativos começaram a comprar em escala; os custos de inferência continuam caindo; as funcionalidades de IA trazem capacidade real de aumento de preços.
Mas se vir o sinal oposto:
Os usuários só querem usar gratuitamente; a versão paga tem má reputação; a plataforma continua reduzindo preços com promoções; usuários de alta frequência estão esgotando os custos; a receita das aplicações de IA está crescendo rapidamente, mas a margem bruta é ruim;
Então o mercado começará a duvidar:
A camada de aplicativos de IA é um bom negócio?
Isso se transmitirá ainda mais para os fornecedores upstream. Pois, se as camadas de aplicação não conseguirem lucrar, os fornecedores de nuvem e de modelos serão questionados: por que vocês ainda estão aumentando continuamente o capex?
Diferentes empresas de IA têm modelos econômicos completamente diferentes
Outro problema é que não se pode agrupar todas as empresas de IA juntas.
1. NVIDIA, TSMC, armazenamento, equipamentos elétricos
Esses são os que vendem picaretas. Quanto mais as pessoas usam IA, mais elas ganham.
Eles não arcam diretamente com o custo dos tokens dos usuários finais, mas sim com os gastos de capital gerados pela expansão da inferência e treinamento de IA.
2. Fornecedores de nuvem: Microsoft, Google, Amazon
Eles estão no meio.
Por um lado, a IA impulsiona o crescimento da receita em nuvem; por outro, ela mesma incorre em altos gastos de capital, depreciação, custos de energia e de data centers. O Reuters Breakingviews destaca que os gastos em IA das grandes empresas estão se expandindo significativamente, mas o mercado também está cada vez mais preocupado se esses investimentos gerarão retornos claros.
Então, o problema dos provedores de nuvem é:
O crescimento da receita da nuvem de IA consegue cobrir os custos de data centers, GPU, depreciação e energia?
3. Empresas de aplicativos de IA: Copilot, ChatGPT, vários Agentes
Quanto mais o usuário usar, maior será o custo. Se for um modelo de assinatura fixa, como cobrar um preço fixo mensal, mas o usuário usar intensivamente, a margem bruta será comprometida.
Portanto, o estado ideal para aplicativos de IA não é “o usuário conversar infinitamente”, mas sim:
O usuário está disposto a pagar um valor elevado, mas o consumo real de tokens é controlável.
Por exemplo, se uma empresa estiver disposta a pagar 30, 50 ou 100 dólares mensais por um assistente de vendas de IA, um assistente de código de IA ou um assistente jurídico de IA, mas o custo de inferência por trás disso for apenas alguns dólares, trata-se de um bom negócio.
4. Empresas de software tradicionais + IA
Empresas como Microsoft, Adobe e Salesforce podem transformar a IA em uma ferramenta de aumento de preços se conseguirem adicionar funcionalidades de IA aos seus softwares existentes, aumentando o ARPU sem descontrolar os custos.
A IA não é um novo empreendimento para eles, mas sim um pacote de aumento de preço baseado nos canais existentes de distribuição de software.
Então, a maior divergência de avaliação da IA está aqui
Não há necessidade de discutir se a IA é útil ou se tem futuro; a IA é certamente o futuro.
A questão mais profunda é: a IA é realmente um software de alta margem ou um negócio intensivo em capital?
Os otimistas acreditam que:
O custo da IA cairá rapidamente, as aplicações explodirão, o ARPU aumentará e, no final, ainda será um negócio de software com alta margem.
Os céticos acreditam que:
A IA se tornará uma corrida armamentista, onde todos precisarão comprar GPUs, construir data centers e pagar contas de energia, mas os usuários talvez não estejam dispostos a pagar preços suficientemente altos por cada token, resultando em lucros devorados pelos custos de infraestrutura.
Acho que a verdade está no meio:
Modelos básicos e infraestrutura em nuvem se tornarão cada vez mais parecidos com indústrias de ativos pesados; apenas aplicações de IA com distribuição real, cenários e poder de precificação terão a oportunidade de voltar a se tornar negócios de software.
Isso também explica por que os sinais de IA podem divergir
Na primeira fase, o mercado está comprando:
Quem tiver alguma ligação com IA, sobe.
Na segunda fase, o mercado perguntará:
Quem pode transformar IA em receita?
Na terceira fase, o mercado continuará a perguntar:
Quem pode transformar a receita de IA em lucro e fluxo de caixa livre?
A IA não tem o mesmo modelo de “vender uma cópia adicional quase sem custo” como o software tradicional; cada serviço prestado consome capacidade de processamento, portanto, possui naturalmente as características de custo de restaurantes, nuvem e empresas industriais.
Mas a IA não é tão linear quanto um restaurante, pois a otimização de modelos, cache, avanços em chips, processamento em lote e roteamento de modelos menores fazem com que o custo por unidade continue caindo.
Então, o que realmente importa no modelo de negócios de IA não é "se há receita", mas:
Quantos GPUs, energia e custos de tokens são gastos para cada dólar de receita de IA.
Esta será a questão central que o mercado repetidamente colocará às empresas de IA nos próximos passos.
Qual é a margem de lucro do futuro da IA?
