Huawei Cloud évite la guerre des prix des jetons et se concentre sur la productivité avec une nouvelle infrastructure IA

icon MarsBit
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Le PDG de Huawei Cloud, Zhou Yuefeng, a déclaré lors de la conférence Huawei Cloud INSPIRE 2026 que l'entreprise évite la guerre des prix des jetons et privilégie plutôt la productivité et l'infrastructure. Les nouveaux produits IA incluent AICS Lingxu, AMS Agentic Memory Storage et CCE Volcano Next. Le cadre Agentic Infra est en cours de déploiement, avec des partenariats auprès de plus de 20 fournisseurs de modèles. L'analyse sur chaîne de l'utilisation de la puissance de calcul révèle une tendance vers des ressources nationalisées, des outils open source et des IA spécifiques aux secteurs, notamment dans les domaines de la santé et de la fabrication.

Agent

« Je ne m’inquiète pas beaucoup du nombre total de tokens ni du montant total des revenus. » Lors de la conférence Huawei Cloud INSPIRE 2026 tenue le 5 juin, Zhou Yuefeng, administrateur de Huawei et PDG de Huawei Cloud, a donné pour la première fois depuis son arrivée une interview aux médias, transmettant clairement et explicitement les priorités stratégiques actuelles de Huawei Cloud.

C'est une déclaration rare sur le marché chinois du cloud AI actuel.

Au cours des six derniers mois, les fournisseurs de cloud, tels qu'Alibaba Cloud et Volcano Engine, ont constamment mis l'accent sur le récit du cloud IA, utilisant le volume quotidien d'appels de tokens et la taille des revenus MaaS comme nouveaux leviers de croissance. Même les fabricants de grands modèles, comme Moonshot, DeepSeek et Zhipu, n'ont cessé de réduire les prix d'inférence. Le mot-clé de toute l'industrie est désormais le volume et la taille des appels de modèles.

Huawei Cloud choisit une autre voie pour entrer sur ce marché surpeuplé. Huawei Cloud a lancé d'un seul coup la plus importante série de nouveaux produits dédiés à l'IA depuis l'année dernière : le cluster de calcul intelligent AICS Lingqu, le stockage à mémoire agente AMS, le moteur d'ordonnancement intégré CCE Volcano Next, la plateforme d'exécution autonome et sécurisée AgentSphere, ainsi que ModelArts Next et la plateforme d'agents d'entreprise AgentArts (version open source openJiuwen), en proposant en bundle le nouveau paradigme « Agentic Infra ».

Zhou Yuefeng n'a pas défini les KPI de Huawei Cloud en termes de nombre de tokens, mais par « chaque token contribue-t-il réellement à améliorer la productivité » ; pendant la fenêtre critique où l'approvisionnement en puissance de calcul nationale est limité et le modèle économique est encore en cours de redéfinition, Huawei Cloud s'est retiré de la course pour devenir le deuxième acteur du cloud AI.

Agent

Pas comparé à la taille du token

Zhou Yuefeng a rarement répondu directement lors de la réunion sur les différences avec Alibaba Cloud et Volcano Engine. Il a déclaré que Huawei Cloud est différente des autres fournisseurs de cloud pour trois raisons.

Premièrement, la stratégie de calcul est différente. Huawei Cloud utilise une infrastructure de calcul entièrement nationale, comprenant l'ensemble du système propriétaire : Ascend, Kunpeng, CANN, Euler, etc. Ce chemin est plus complexe, car Huawei ne peut pas utiliser des ressources de calcul externes ; il doit transformer la souveraineté technologique nationale en une solution industrielle.

Ainsi, Huawei Cloud doit créer un deuxième plan de calcul, offrant une autre option d'écosystème en dehors du chemin dominant mondial constitué par NVIDIA et les principaux clouds publics. Huawei Cloud ne peut ni ne souhaite rivaliser avec ses concurrents en termes de taille de calcul en utilisant du matériel « de toutes les marques ». Zhou Yuefeng déclare : « Je ne veux pas comparer mon revenu ou ma taille avec ceux des autres fournisseurs de cloud, ce n’est pas pertinent. »

Deuxièmement, les priorités commerciales sont différentes. Les fournisseurs de cloud issus d'entreprises internet dépendent naturellement du trafic grand public et de l'écosystème des développeurs, tandis que Huawei Cloud concentre ses efforts sur les secteurs publics, des entreprises et d'intérêt national. Par exemple, Huawei Cloud Hybride occupe la première place sur le marché des gouvernements, de la finance et des entreprises d'État depuis plusieurs années consécutives, servant plus de 5 500 clients dans le monde.

Zhou Yuefeng a déclaré que la vitesse d'itération des modèles et de la puissance de calcul est trop rapide, ce qui fait que les systèmes déployés risquent déjà d'être obsolètes. Il recommande donc aux clients institutionnels et entreprises de ne pas construire leurs propres clusters de dix mille GPU, mais d'utiliser des données locales combinées à des services de puissance de calcul et de modèles AI sur le cloud public, en associant des technologies telles que l'inférence confidentielle, l'entraînement confidentiel et le calcul confidentiel, afin d'établir un équilibre entre la souveraineté des données et le partage de la puissance de calcul. En substance, cela consiste à transférer les avantages d'itération du cloud public aux clients qui ne peuvent pas entièrement migrer vers le cloud public.

Troisièmement, la stratégie écosystémique est différente. Huawei Cloud a mené une démarche open source très poussée :昇腾CANN, le système d'exploitation Euler, le planificateur CCE Volcano et la chaîne d'outils ModelArts sont tous open source. La version open source de la plateforme d'agents AgentArts, openJiuwen, partage plus de 90 % de son noyau avec la version commerciale.

Lors de la réunion, plus de 20 principaux fournisseurs de modèles, dont Zhipu, DeepSeek, MiniMax, Kimi, Jieyue Xingchen, Baidu, Meituan LongCat et iFlytek Spark, ont lancé conjointement le plan « Cent modèles, mille formes, convergence dans le cloud pour une croissance mutuelle ».

Lorsque la puissance de calcul nationale reste limitée en termes de capacité et d'offre, plus l'écosystème est étendu et plus le choix de modèles est large, le deuxième plan de calcul pourra s'établir solidement.

Agentic Infra : Déplacer le champ de bataille de la vente de tokens à la vente de productivité

Si la stratégie de puissance de calcul détermine ce que Huawei Cloud ne fait pas, l'infrastructure agente détermine ce qu'elle souhaite faire.

Zhou Yuefeng a émis un jugement sur l'évolution de l'industrie de l'IA : il y a quatre ans, faire de l'IA consistait à acheter des cartes de calcul ; il y a trois ans, à entraîner de grands modèles ; cette année, il s'agit d'utiliser des agents intelligents. Le calcul et les modèles reculent en arrière-plan, tandis que les agents intelligents prennent le devant de la scène.

Le centre de la concurrence dans le cloud IA passe de la capacité de traitement de tokens à la capacité des agents à fonctionner réellement dans les entreprises.

La gamme de produits Huawei Cloud a également été réorganisée selon ce critère : les « quatre éléments » de l’infrastructure agente — usine à tokens efficace, apprentissage continu, ordonnancement intégré intelligence et sécurité autonome — correspondent chacun à des défis techniques incontournables lors du déploiement d’agents par les entreprises.

AICS Lingqu réduit la latence des jetons pour un cluster de 100 000 cartes à moins de 10 millisecondes ; AMS utilise un accès direct NPU vers CMS pour créer un espace mémoire de niveau PB, résolvant ainsi le goulot d'étranglement de la mémoire pour les tâches à long terme des agents ; CCE Volcano Next augmente l'utilisation des ressources de plus de 30 % grâce à un pool partagé pour l'entraînement et l'inférence ; AgentSphere réalise un démarrage en moins de 100 millisecondes et une création par lot de cent mille agents par minute grâce à un sandbox léger.

ModelArts Next a重构é la plateforme MaaS ; son routage de modèles prend en charge trois stratégies : priorité au coût, priorité aux performances et équilibre. Il intègre plus de 15 modèles SOTA, avec un taux de précision de planification supérieur à 95 % et une réduction moyenne des coûts d'appel de 20 %.

Mais le véritable pari différenciant d'Huawei Cloud réside dans les zones dédiées aux secteurs. Lors de ce salon, Huawei Cloud a lancé en une seule fois quatre zones « usines d'IA sectorielles » : soins de santé intelligents, intelligence incarnée, fabrication intelligente et calcul scientifique.

La zone dédiée à la santé intelligente, en collaboration avec l'Hôpital Ruijin de Shanghai, a développé le grand modèle RuiPath, qui a vu l'installation regroupée de plus de vingt hôpitaux de niveau III, A et B, ainsi que des hôpitaux de district et de comté, tels que ceux de Handan, Ruian, Qianxinan et Wu'an. Cela signifie que des compétences hautement dépendantes de l'expérience des experts, comme le diagnostic pathologique, sont pour la première fois diffusées à grande échelle vers les hôpitaux de comté sous forme de « service cloud ».

La section Intelligence Embodiment lance CloudRobo, la première plateforme de développement d'intelligence embodiment à l'échelle mondiale, visant à répondre aux besoins en outils complets de plus de 300 startups chinoises en intelligence embodiment.

Zhou Yuefeng a déclaré que la santé et la finance sont les secteurs les plus matures et les plus riches en données en matière de numérisation en Chine : « Si l'IA ne peut pas réussir dans ces secteurs, il sera encore plus difficile dans les autres ». Dans ces domaines, la mesure de la valeur de l'IA ne devrait pas être le nombre d'utilisateurs actifs quotidiens ou le nombre de jetons, mais plutôt le taux de prévention des risques financiers, l'amélioration de l'efficacité du crédit et la probabilité pour les patients éloignés d'obtenir un diagnostic précis.

En reliant ces indices, le profil stratégique de Huawei Cloud devient clair : une base constituée de capacités de calcul entièrement nationales et d’un écosystème open source, une couverture des entreprises et du secteur public grâce au cloud hybride et au calcul confidentiel, et un déplacement de la concurrence de la « vente de tokens » vers la « vente de productivité » grâce à l’infrastructure agente et aux zones sectorielles.

Ce chemin est beaucoup plus lent pour générer des revenus MaaS et plus difficile à présenter avec de beaux chiffres annuels, mais il évite la guerre des prix la plus acharnée dans le cloud IA actuelle pour miser sur un marché encore non évalué : celui où les agents intelligents pénètrent réellement l'industrie, et où celui qui occupera la position d'infrastructure sous-jacente restera à déterminer.

Dans ce domaine du cloud IA, Huawei Cloud ne peut adopter qu'une autre approche. « Je ne peux pas construire une terre noire en silicium faite de composants de plusieurs pays », résume Zhou Yuefeng. Alors que d'autres fournisseurs de cloud se disputent qui offre le meilleur rapport qualité-prix des tokens, Huawei Cloud mise sur la capacité de ce système de calcul national à répondre aux véritables besoins de l'industrie chinoise en matière d'IA à l'avenir. (Auteur de cet article : Zhang Shuai, éditeur : Yang Lin)

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.