
"Não me importo muito com o total de tokens nem com o total de receita." Na conferência Huawei Cloud INSPIRE Dreamers 2026, realizada em 5 de junho, Zhou Yuefeng, membro do conselho da Huawei e CEO da Huawei Cloud, concedeu sua primeira entrevista à mídia desde sua nomeação, transmitindo clara e explicitamente o foco estratégico atual da Huawei Cloud.
Esta é uma declaração rara no mercado chinês de nuvem de IA atual.
Nos últimos seis meses, provedores de nuvem como Alibaba Cloud e Volcano Engine têm enfatizado continuamente a narrativa da nuvem de IA, utilizando o volume diário de chamadas de tokens e o tamanho da receita de MaaS como novos pontos de crescimento. Mesmo fabricantes de grandes modelos, como Moonshot, DeepSeek e Zhipu, vêm reduzindo constantemente os preços de inferência; a palavra-chave de toda a indústria é o volume e a escala das chamadas de modelos.
A Huawei Cloud optou por entrar neste mercado movimentado de outra maneira. A Huawei Cloud lançou, de uma só vez, o conjunto mais denso de novos produtos voltados para IA desde o ano passado: o cluster de computação inteligente AICS LingQu, o armazenamento com memória agêntica AMS, o motor de agendamento integrado CCE Volcano Next, a base de execução autônoma e segura AgentSphere, além do ModelArts Next e da plataforma empresarial de agentes inteligentes AgentArts (versão open-source openJiuwen), apresentando conjuntamente o novo paradigma "Agentic Infra".
Zhou Yuefeng definiu os KPIs da Huawei Cloud não como o número de tokens, mas sim como "se cada token realmente aumentou a produtividade por trás dele". Durante o período em que o fornecimento de capacidade de computação nacional está limitado e o modelo de negócios ainda está sendo reestruturado, a Huawei Cloud retirou-se da disputa pelo segundo lugar na nuvem de IA.

Não comparável ao tamanho do token
Zhou Yuefeng raramente respondeu diretamente à diferença entre a Huawei Cloud e a Alibaba Cloud e o Volcano Engine na reunião de encontro. Ele disse que a Huawei Cloud é diferente de outras provedoras de nuvem por três razões.
Primeiro, a rota de poder de computação é diferente. O Huawei Cloud utiliza um conjunto completo de hardware e software de computação totalmente nacional, incluindo toda a arquitetura proprietária Ascend, Kunpeng, CANN e Euler. Esse caminho é mais complexo, pois a Huawei não pode usar poder de computação de terceiros e precisa transformar a nacionalização em uma solução em escala industrial.
Por isso, a Huawei Cloud precisa criar um segundo plano de computação, oferecendo uma alternativa ecológica além da trajetória global dominante composta por NVIDIA e principais nuvens públicas. A Huawei Cloud não pode nem pretende competir com concorrentes em escala de computação usando hardware "de várias marcas". Zhou Yuefeng disse: "Não quero competir com outras empresas de nuvem para ver quem é a segunda, terceira ou outra posição em receita ou escala; não faz sentido."
Em segundo lugar, o foco comercial é diferente. Fornecedores de nuvem ligados à internet dependem naturalmente de tráfego de consumidores e ecossistemas de desenvolvedores, enquanto a Huawei Cloud concentra seus principais esforços nos setores governamental e empresarial, bem como em indústrias estratégicas para a economia e o bem-estar público. Por exemplo, a nuvem híbrida da Huawei lidera há vários anos consecutivos em participação de mercado no setor governamental, financeiro e em empresas estatais, atendendo mais de 5.500 clientes em todo o mundo.
Zhou Yuefeng afirmou que a velocidade de iteração de modelos e capacidade de processamento é muito rápida, o que pode fazer com que a implementação já esteja obsoleta assim que for concluída. Por isso, ele sugere que clientes governamentais e empresariais não construam clusters de milhares de GPUs por conta própria, mas sim utilizem dados locais combinados com serviços de IA em nuvem pública e capacidade de processamento, integrando tecnologias como inferência confidencial, treinamento confidencial e computação confidencial, para equilibrar a soberania de dados e o compartilhamento de capacidade de processamento. Essencialmente, isso transfere os benefícios de iteração da nuvem pública para clientes que não podem migrar completamente para a nuvem pública.
Terceiro, a abordagem ecológica é diferente. A Huawei Cloud conduziu a abertura de código de forma bastante abrangente: o昇腾CANN, o sistema operacional OpenEuler, o agendamento CCE Volcano e a cadeia de ferramentas ModelArts são todos de código aberto; a versão de código aberto da plataforma de agentes AgentArts, openJiuwen, possui mais de 90% de similaridade com sua versão comercial.
Na reunião, mais de 20 das principais empresas de modelos, incluindo Zhipu, DeepSeek, MiniMax, Kimi, Jieyue Xingchen, Baidu, Meituan LongCat e iFlytek Spark, lançaram conjuntamente o plano "Cem Modelos, Mil Formas, Convergência na Nuvem para Benefício Mútuo".
Quando a capacidade e o fornecimento de computação nacional ainda forem limitados, quanto maior for o ecossistema e maior for a variedade de modelos, mais sólido será o segundo plano de computação.
Agentic Infra: Mover o campo de batalha da venda de tokens para a venda de produtividade
Se a rota de capacidade de processamento determina o que a Huawei Cloud "não faz", a Agentic Infra determina o que ela "quer fazer".
Zhou Yuefeng fez uma previsão sobre a evolução da indústria de IA: há quatro anos, fazer IA significava comprar cartões de computação; há três anos, treinar grandes modelos; este ano, usar agentes inteligentes. A computação e os modelos estão recuando para o cenário de fundo, enquanto os agentes inteligentes assumem o palco principal.
O foco da competição na nuvem de IA passou da taxa de transferência de tokens para se os agentes conseguem realmente operar dentro das empresas.
A matriz de produtos da Huawei Cloud também foi reorganizada com base nesse critério: os "quatro pilares" da Agentic Infra — fábrica eficiente de tokens, aprendizado contínuo, agendamento integrado de inteligência e autossuficiência em segurança — cada um corresponde a desafios de engenharia inevitáveis ao implantar agentes empresariais.
AICS Lingqu reduziu a latência do token de clusters de 100 mil para menos de 10 milissegundos; AMS utiliza NPU direto para CMS para criar um espaço de memória em PB, resolvendo o gargalo de memória para tarefas de longo prazo de Agentes; CCE Volcano Next aumentou a utilização de recursos em mais de 30% por meio de pool compartilhado para treinamento e inferência; AgentSphere implementa sandbox leve para inicialização em milissegundos e criação em lote de até 100 mil por minuto.
ModelArts Next reestruturou a abordagem de MaaS, oferecendo roteamento de modelos com três estratégias: prioridade de custo, prioridade de desempenho e equilíbrio. Já integrou mais de 15 modelos SOTA, com precisão de agendamento superior a 95% e redução média de 20% nos custos de chamada.
Mas o verdadeiro diferencial da Huawei Cloud é a aposta em áreas setoriais. Nesta conferência, a Huawei Cloud lançou simultaneamente quatro áreas "Fábricas de IA para Setores": saúde inteligente, inteligência embutida, manufatura inteligente e cálculo científico.
A área especializada em saúde inteligente, em parceria com o Hospital Ruijin de Xangai, desenvolveu o grande modelo RuiPath, com mais de 20 hospitais de nível III-A, municipais e distritais, como Handan, Ruian, Qianxinan e Wu'an, se instalando coletivamente. Isso significa que, pela primeira vez, habilidades altamente dependentes da experiência de especialistas, como diagnóstico patológico, estão sendo escalonadas e disponibilizadas para hospitais distritais na forma de "serviço em nuvem".
A seção de Inteligência Embodiment apresenta o CloudRobo, a primeira plataforma de desenvolvimento de inteligência embodiment com fluxo completo do mundo, com o objetivo de atender às necessidades de ferramentas de ponta a ponta de mais de 300 empresas chinesas de inteligência embodiment.
Zhou Yuefeng afirmou que saúde e finanças são os setores mais maduros e com os dados mais ricos da digitalização na China: "Se a IA não conseguir prosperar nesses setores, será ainda mais difícil em outros". Nesses campos, a medida do valor da IA não deve ser o número de usuários diários ou o número de tokens, mas sim a proporção de prevenção de riscos financeiros, o aumento da eficiência de crédito e a probabilidade de pacientes em áreas remotas receberem diagnósticos precisos.
Ligando essas pistas, o contorno estratégico da Huawei Cloud fica claro: usar infraestrutura de computação totalmente nacional e ecossistema de código aberto como base, cobrir o setor público e corporativo com nuvem híbrida e computação confidencial, e deslocar a concorrência de “vender tokens” para “vender produtividade” por meio de Agentic Infra e áreas setoriais.
Este caminho é muito mais lento para gerar receita MaaS e mais difícil de apresentar dados anuais comparáveis impressionantes, mas evita a feroz guerra de preços atual na nuvem de IA, apostando em um mercado ainda não precificado: quem ocupará a posição de infraestrutura subjacente quando os agentes inteligentes entrarem verdadeiramente na indústria.
Nesta corrida da nuvem de IA, a Huawei Cloud só pode adotar uma abordagem diferente. Zhou Yuefeng resumiu: "Não consigo construir um solo silício de marcas internacionais." Enquanto outras provedoras de nuvem competem para ver quem oferece o melhor custo-benefício de tokens, a Huawei Cloud está se esforçando para determinar se este sistema de capacidade de processamento nacional pode atender às reais necessidades da indústria chinesa em IA no futuro. (Autor deste artigo | Zhang Shuai, Editor | Yang Lin)


