L'IA domestique entre en phase de commercialisation alors que Doubao teste un modèle d'abonnement

iconMetaEra
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Doubao, une application d'intelligence artificielle chinoise de premier plan, teste un modèle d'abonnement avec des tarifs mensuels à 68 RMB, 200 RMB et 500 RMB, ainsi qu'une version gratuite. L'augmentation des coûts liés à la création vidéo et à l'analyse de données pousse les entreprises d'IA vers la monétisation. Les revenus fixes issus des abonnements doivent désormais couvrir les dépenses variables en jetons et en calcul. L'indice de peur et de cupidité chez les investisseurs montre une prudence croissante, les données sur l'inflation restant une préoccupation majeure pour la rentabilité à long terme. Un modèle de monétisation en quatre niveaux — gratuit, à faible coût, professionnel et entreprise — pourrait façonner l'avenir de l'industrie.
La nature abonnée de l'IA consiste à transformer un coût de puissance de calcul imprévisible en une structure de revenus prévisible, ce qui constituera la question centrale que le marché posera répétitivement aux entreprises d'IA.

Auteur de l'article, source : Wu Duidui

L'IA nationale arrive enfin à ce stade : il ne s'agit plus seulement de parler des utilisateurs, mais aussi de gagner de l'argent.

La phase d'acquisition gratuite est terminée ; les applications IA entrent désormais dans la phase de « segmentation des coûts + segmentation des utilisateurs + validation commerciale ».

Récemment, la page de l'App Store de Doudou a affiché des informations d'abonnement payant : en plus de la version de base gratuite, il pourrait y avoir une version standard à 68 yuans/mois, une version renforcée à 200 yuans/mois et une version professionnelle à 500 yuans/mois, avec un abonnement annuel maximal de 5 088 yuans.

La réponse de DouBao sera toujours disponible en tant que service gratuit ; les options de service premium sont encore en test et ne sont pas encore officiellement affichées dans le produit.

This matter can be viewed from several perspectives.

Cela est lié au coût, en particulier au « coût des utilisateurs intensifs »

Le problème avec un produit comme DouBao, c'est que plus les utilisateurs l'apprécient, plus le coût pour la plateforme augmente.

Un utilisateur ordinaire posant quelques questions de temps en temps peut avoir un coût maîtrisé.

Mais si l'utilisateur commence à faire ces choses :

Écrire des articles longs, générer des présentations PowerPoint, effectuer des analyses de données, réaliser des recherches approfondies, générer des images, générer des vidéos, dialoguer en temps réel par voix, exécuter des tâches en plusieurs étapes par Agent.

Ce n'est alors plus du tout le même niveau de coût.

Les fonctionnalités principales de la version Mac de Doubao, en plus du chat, incluent la recherche, la retouche d'images, l'écriture, la traduction, les présentations PowerPoint et l'analyse de données, avec un accent mis sur la génération d'images et de vidéos, la recherche approfondie, les comptes rendus de réunions et le traitement de documents et de tableaux, offrant un flux de travail tout-en-un. Ces fonctionnalités exigent fondamentalement davantage de tokens, plus de puissance de raisonnement et plus de capacité de calcul multimodale que les conversations ordinaires.

Donc, la facturation de Doubao est très probablement due non pas à « une perte insupportable sur les discussions ordinaires », mais à :

Les capacités à haute valeur et les utilisateurs intensifs ne peuvent plus être fournies gratuitement à l'infini.

La version gratuite peut continuer à exister en tant qu'entrée, pour l'activité quotidienne et la notoriété de la marque ; mais les fonctionnalités les plus gourmandes en ressources doivent être hiérarchisées via des abonnements, des quotas, des priorités et une version professionnelle.

La difficulté de la commercialisation de l'IA réside dans « un revenu fixe, mais des coûts variables ».

Le modèle d'abonnement présente une contradiction naturelle :

Le montant payé par l'utilisateur chaque mois est fixe, mais la quantité de tokens consommée n'est pas fixe.

Cela diffère de Netflix, Tencent Video ou iQIYI. Sur les plateformes vidéo, une fois qu’une série est produite, chaque visionnage supplémentaire entraîne un coût marginal relativement limité. L’IA, en revanche, nécessite de réallouer des ressources d’inférence à chaque conversation approfondie, chaque génération de vidéo et chaque analyse de contexte long.

Les modèles de logiciels traditionnels et le modèle Netflix ressemblent plus à :

Développer une fois → Copier une infinité de fois → Le coût marginal de la vente supplémentaire approche 0

Mais les services de grands modèles ressemblent davantage à :

Modèle de recherche développé une fois → Chaque appel nécessite de la puissance de calcul → Plus il y a d'utilisateurs et plus ils l'utilisent intensément, plus le coût d'inférence augmente.

Les API telles qu'OpenAI et Azure OpenAI sont facturées selon les tokens, ce qui illustre précisément ce fait : les tokens d'entrée, les tokens de sortie, les contextes longs et les entrées mises en cache ont des prix différents, les tokens de sortie étant généralement nettement plus chers.

Sur la page de tarification officielle d'OpenAI, le contexte court de GPT-5.5 est facturé 2,5 $ par million de tokens en entrée et 15 $ par million de tokens en sortie, avec des coûts beaucoup plus faibles pour les entrées en cache.

Ce n'est pas le même modèle économique que de vendre Office, Photoshop ou un système d'exploitation.

Le moteur VolcEngine de ByteDance lui-même applique une logique similaire : les prix du modèle Doubao sont également facturés par million de tokens, par exemple, Doubao-Seed-2.0-pro est affiché à partir de 3,2 yuans par million de tokens d'entrée et 16 yuans par million de tokens de sortie.

Cela révèle un problème fondamental :

Les produits IA semblent être des abonnements membres, mais en arrière-plan, ils sont facturés à la consommation. Toutefois, ils ne sont pas entièrement comparables à un restaurant.

Une formulation plus précise serait :

L'IA est un mélange d'entreprise logicielle, d'entreprise de cloud computing et d'entreprise industrielle intensive en énergie.

Si un utilisateur paie 68 yuans par mois mais génère frénétiquement des présentations PPT, des vidéos et de longs rapports, les coûts pourraient absorber la majeure partie de ses revenus.

Si un utilisateur paie 500 yuans par mois, mais les utilise principalement pour des travaux à haute valeur ajoutée avec une consommation maîtrisée, c’est une bonne affaire.

Ainsi, l'abonnement AI consiste essentiellement à faire une chose :

Transformez les coûts de puissance de calcul hors contrôle en une structure de revenus prévisible.

Passer de la concurrence basée sur la taille de l'utilisateur à la concurrence basée sur l'ARPU

Auparavant, la concurrence des applications d'IA en Chine reposait en grande partie sur la gratuité pour attirer des utilisateurs.

Pourquoi DouBao a-t-il réussi ? Outre ses avantages produits, cela s'explique également par le flux de trafic de ByteDance, ses compétences produit et son seuil d'entrée gratuit. DouBao est l'application de chat IA la plus utilisée en Chine ; selon les données de QuestMobile, son nombre d'utilisateurs actifs hebdomadaires s'élève à environ 155 millions, contre 81,6 millions pour DeepSeek ; Alibaba stimule également la croissance des utilisateurs de Qwen grâce à des subventions importantes.

Mais le mode gratuit présente un problème :

Plus le nombre d'utilisateurs est important, plus la pression sur les coûts est réelle.

En particulier, les produits chinois d'IA sont actuellement engagés dans une guerre des prix. DeepSeek a considérablement réduit les coûts attendus des modèles, tandis que Alibaba, ByteDance, Tencent et Baidu ne veulent pas perdre leur accès. Il en résulte une situation embarrassante pour l'IA grand public :

Les utilisateurs pensent que l'IA devrait être gratuite ; la plateforme sait que l'IA ne peut pas être infiniment gratuite ; les investisseurs veulent voir une croissance ; l'entreprise interne cherche à établir une boucle commerciale.

La version payante de Doubao signifie qu'elle souhaite tester une question :

Les utilisateurs chinois sont-ils vraiment prêts à payer pour des flux de travail IA ?

Ne payez pas pour « discuter », mais pour « gagner du temps, créer des présentations, rédiger des rapports, effectuer des recherches, traiter des données, générer des vidéos ».

This difference is crucial.

Les utilisateurs ont du mal à payer 500 yuans par mois pour « tu me tiens compagnie ».

Mais s'il peut vraiment aider un professionnel du contenu, un vendeur, un enseignant, un étudiant, un opérateur ou un conseiller à gagner 1 à 2 heures par jour, alors l'acceptabilité des prix de 68 yuans, 200 yuans ou 500 yuans sera totalement différente.

Cela signifie également que la version gratuite de l'IA sera conservée, mais deviendra de plus en plus « limitée ».

À l'avenir, les applications natives d'IA en Chine adopteront probablement une structure en quatre niveaux plutôt qu'un modèle de tarification unique :

Niveau 1 : Version gratuite

Pour l'acquisition de clients, l'établissement d'habitudes d'utilisation et le maintien de la part de marché. Les discussions informelles, les réponses aux questions de base et les recherches légères resteront gratuites.

Niveau 2 : Abonnement à prix réduit

Pour les utilisateurs fréquents ordinaires, comme des limites plus élevées, des vitesses plus rapides, moins d'attente et de meilleurs modèles.

Niveau 3 : Version professionnelle

Pour les créateurs de contenu, les professionnels, les étudiants, les programmeurs et les chercheurs : vente de présentations PPT, analyse de données, recherches approfondies, traitement de documents, code et contextes longs.

Niveau 4 : Services entreprise/API/Agent

Paiement à la consommation ou forfait + frais pour les dépassements. C’est ici que réside véritablement le modèle économique.

Les trois niveaux de 68, 200 et 500 actuellement diffusés par DouBao visent essentiellement à tester cette segmentation.

La version gratuite résout le problème de la « taille de l'utilisateur » ; la version standard résout le problème du « paiement léger » ; les versions renforcée et professionnelle résolvent le problème du « recouvrement des coûts pour les utilisateurs intensifs ».

ChatGPT, Claude, Gemini, Kimi, Tongyi, Zhipu, Doudou, tous ont déjà ou vont bientôt adopter une structure similaire. La différence réside uniquement dans : quelle version gratuite est la plus puissante, quels avantages payants sont les plus perceptibles, et qui contrôle le mieux ses coûts.

Pourquoi les abonnements AI sont-ils plus difficiles que les SaaS traditionnels ?

Chaque utilisateur supplémentaire, chaque conversation supplémentaire, chaque résumé de texte long supplémentaire et chaque tâche supplémentaire exécutée par un agent consomme davantage de GPU, d'électricité, de mémoire vidéo, de bande passante, de stockage et de ressources d'ingénierie et de maintenance.

Alors, la question la plus cruciale pour les entreprises d'applications d'IA n'est pas :

Y a-t-il des utilisateurs ?

au lieu de :

Plus il y a d'utilisateurs, plus on gagne de l'argent, ou plus on en dépense ?

Cela diffère fortement des SaaS traditionnels. Dans les SaaS traditionnels, une fois le système mis en place, la marge brute sur de nouveaux clients est généralement élevée ; mais pour un produit IA, si les utilisateurs l'utilisent intensément, cela peut au contraire entraîner des coûts d'inférence plus élevés. La préoccupation actuelle du marché concernant le retour sur investissement des grandes entreprises technologiques dans l'IA repose fondamentalement sur ce problème. Alphabet, Microsoft, Meta, Amazon et d'autres géants ont réalisé cette année d'énormes investissements liés à l'IA, et les investisseurs commencent à se concentrer davantage sur le moment où ces dépenses IA généreront un retour suffisant.

Cependant, un abonnement IA ne peut bien sûr pas être simplement comparé à un restaurant, car il est difficile pour un restaurant de réduire le coût d’un bol de nouilles de 80 % chaque année.

Mais l'IA peut.

Parce que les coûts d'inférence du modèle sont constamment réduits par plusieurs facteurs :

Premièrement, les puces deviennent plus puissantes. Deuxièmement, les modèles deviennent plus petits, avec distillation, quantification et routage MoE plus précis. Troisièmement, le cache, le batch processing et la réutilisation du contexte réduisent les coûts de calcul répétitif. Quatrièmement, de nombreuses tâches n'exigent pas le modèle le plus puissant et peuvent être réalisées avec des modèles plus petits. Cinquièmement, les entreprises passeront de « l'accumulation aveugle de tokens » à « la consommation de moins de tokens par résultat métier ».

Ainsi, le coût marginal de l'IA n'est pas de 0, mais il n'est pas non plus un coût fixe d'ingrédients.

C'est comme le début du cloud computing : au départ, c'était cher, mais l'échelle, l'optimisation du matériel et du logiciel réduiront continuellement les coûts.

C'est aussi pourquoi les « entrées mise en cache » sont beaucoup moins chères dans la tarification d'OpenAI. La simple existence de ce mécanisme de mise en cache montre que les fournisseurs d'IA s'efforcent de transformer les calculs répétitifs en des étapes plus économiques, quasi logicielles.

Cela oblige les entreprises d'IA à répondre simultanément à trois questions :

Premièrement, combien les utilisateurs sont-ils prêts à payer ? C'est le côté revenus.

Deuxièmement, combien de tokens les utilisateurs consomment-ils par mois ? Cela concerne le côté des coûts.

Troisièmement, la baisse des coûts du modèle pourra-t-elle surpasser la croissance de l'utilisation ? C'est du côté de la marge bénéficiaire.

If the answer is:

L'utilisateur est prêt à payer 200 yuans, mais les coûts mensuels s'élèvent à 150 yuans, donc cette entreprise est assez ordinaire.

Si la réponse est : l'utilisateur est prêt à payer 200 yuans ; le coût n'est que de 20 yuans et peut encore être réduit à 10 yuans grâce à l'optimisation du modèle.

Les applications IA retrouvent à nouveau une proximité avec un bon métier logiciel.

Ainsi, le véritable indicateur clé du modèle économique de l'IA n'est pas le DAU, ni le nombre de téléchargements, mais :

Revenu par utilisateur payant / Coût d'inférence par utilisateur payant.

C'est-à-dire le modèle économique unitaire version IA.

Cela influencera à son tour les tendances de l'IA

En lien avec le marché boursier, cela est en réalité très important.

Le marché trade actuellement l'IA, la première phase examine :

La demande de puissance de calcul va-t-elle exploser ?

Ainsi, NVIDIA, TSMC, Broadcom, le stockage, les équipements électriques et les centres de données ont augmenté.

La deuxième phase du marché posera la question :

Les applications d'IA ont-elles des utilisateurs ?

La taille des utilisateurs de ChatGPT, Doudou, Kimi, Qwen, Copilot et Gemini sera surveillée.

La troisième phase, qui est la phase la plus cruciale à venir, le marché se demandera :

Ces utilisateurs peuvent-ils payer ? Peuvent-ils gagner de l'argent après paiement ?

La nouvelle selon laquelle DouBao va commencer à facturer correspond simplement au début de la troisième phase.

Si ces signaux apparaissent à l'avenir, le marché AI sera plus sain :

Le taux de conversion payant est bon ; les utilisateurs n'ont pas massivement quitté en raison des frais ; des clients paient pour la version professionnelle haut de gamme ; les clients entreprises commencent à passer des commandes à grande échelle ; les coûts d'inférence continuent de diminuer ; les fonctionnalités IA apportent une véritable capacité à augmenter les prix.

Mais si vous voyez le signal inverse :

Les utilisateurs ne veulent utiliser que la version gratuite ; la version payante a une mauvaise réputation ; la plateforme réduit constamment ses prix pour promouvoir ses offres ; les utilisateurs fréquents font exploser les coûts ; les revenus provenant des applications IA augmentent rapidement, mais la marge brute est faible.

Alors le marché commencera à douter :

L'application de l'IA est-elle un bon métier ?

Cela se répercutera davantage en amont. Car si les applications ne génèrent pas de revenus, les fournisseurs de cloud et les fabricants de modèles se verront demander : pourquoi continuer à augmenter vos dépenses en immobilisations ?

Différentes entreprises d'IA ont des modèles économiques complètement différents

Il y a aussi un problème : on ne peut pas regrouper toutes les entreprises d'IA ensemble.

1. NVIDIA, TSMC, stockage, équipements électriques

Ce sont ceux qui vendent les pioches. Plus les autres utilisent l'IA, plus ils gagnent d'argent.

Ils ne supportent pas directement le coût des tokens pour les utilisateurs finaux, mais absorbent les dépenses en capital générées par l'expansion de l'inférence et de l'entraînement IA.

2. Fournisseurs de cloud : Microsoft, Google, Amazon

They are in between.

D'un côté, l'IA génère une croissance des revenus cloud ; de l'autre, elle impose des coûts importants en capitaux, amortissements, électricité et infrastructures de centres de données. Reuters Breakingviews souligne que les dépenses IA des grands acteurs s'élargissent considérablement, mais le marché s'inquiète de plus en plus de la capacité de ces investissements à générer des rendements clairs.

Le problème des fournisseurs de cloud est :

La croissance des revenus du cloud IA peut-elle couvrir les coûts des centres de données, des GPU, de l'amortissement et de l'électricité ?

3. Entreprises d'applications IA : Copilot, ChatGPT, divers agents

Plus les utilisateurs en utilisent, plus les coûts augmentent. Si c'est un abonnement fixe, par exemple un prix mensuel fixe, mais que les utilisateurs en font un usage intensif, la marge brute sera compromise.

Ainsi, l'état idéal des applications d'IA n'est pas « l'utilisateur qui discute sans fin », mais :

Les utilisateurs sont prêts à payer un prix élevé, mais la consommation réelle de jetons reste maîtrisée.

Par exemple, si une entreprise est prête à payer 30, 50 ou 100 dollars par mois pour un assistant commercial IA, un assistant de codage IA ou un assistant juridique IA, alors que le coût de calcul sous-jacent n’est que de quelques dollars, c’est un bon commerce.

4. Entreprises logicielles traditionnelles + IA

Par exemple, des entreprises comme Microsoft, Adobe ou Salesforce peuvent transformer l'IA en outil de hausse des prix si elles intègrent des fonctionnalités d'IA dans leurs logiciels existants pour augmenter leur ARPU sans faire exploser leurs coûts.

L'IA ne constitue pas une nouvelle entreprise pour eux, mais un package de surcoût AI ajouté aux canaux de distribution de logiciels existants.

C'est donc ici que réside la plus grande divergence d'évaluation de l'IA

Il ne sert à rien de discuter de l’utilité ou de l’avenir de l’IA ; l’IA est évidemment l’avenir.

La question plus profonde est : l’IA est-elle un logiciel à forte marge ou un secteur industriel intensif en capital ?

Les optimistes estiment que :

Les coûts de l'IA baisseront rapidement, les applications exploseront, l'ARPU augmentera, et au final, ce sera toujours un métier logiciel à forte marge.

Les pessimistes estiment que :

L'IA deviendra une course aux armements, où tout le monde devra acheter des GPU, construire des centres de données et payer les factures d'électricité, mais les utilisateurs ne seront peut-être pas disposés à payer un prix suffisamment élevé pour chaque token, ce qui fera que les bénéfices seront absorbés par les coûts d'infrastructure.

Je pense que la vérité est au milieu :

Les modèles de base et les infrastructures cloud deviendront de plus en plus semblables à des industries à forts investissements ; seules les applications AI réellement dotées de distribution, de scénarios et de pouvoir de fixation des prix auront la possibilité de redevenir des activités logicielles.

Cela explique également pourquoi les tendances IA peuvent diverger.

Au premier stade, le marché achète :

Celui qui a un lien avec l'IA, ça monte.

À la deuxième étape, le marché se demandera :

Qui peut transformer l'IA en revenu ?

À la troisième étape, le marché continuera à se demander :

Qui peut transformer les revenus de l'IA en bénéfices et en flux de trésorerie libre ?

L'IA ne présente pas le même avantage coût que les logiciels traditionnels, où vendre une unité supplémentaire coûte presque rien ; chaque service d'IA consomme de la puissance de calcul, ce qui lui confère naturellement les caractéristiques de coûts d'un restaurant, d'une infrastructure cloud ou d'une entreprise industrielle.

Mais l’IA n’est pas aussi linéaire qu’un restaurant, car l’optimisation des modèles, le cache, les progrès des puces, le traitement par lots et le routage de petits modèles font continuellement baisser le coût unitaire.

Ainsi, ce qui compte vraiment dans le modèle économique de l'IA, ce n'est pas « s'il y a des revenus », mais :

Combien de GPU, d'électricité et de coûts en tokens sont nécessaires pour chaque dollar de revenu généré par l'IA.

Cela sera la question centrale que le marché posera sans cesse aux entreprises d'IA.

Quel est le taux de marge potentiel de l'IA ?

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.