DeepSeek réduit définitivement les prix de son API face à la hausse des coûts de l'IA

Article | Chaîne Luo Chao

DeepSeek annonce la pérennisation d'une réduction de 75 % sur l'API V4-Pro, effective mondiale.

Le système de prix final : le prix d'entrée de base est passé de 1,74 $ / million de tokens à 0,435 $ / million de tokens, et le prix de sortie est passé de 3,48 $ / million de tokens à 0,87 $ / million de tokens. Pour les hits de cache d'entrée sur toute la gamme de produits API, DeepSeek a appliqué une réduction plus importante : 0,003625 $ / million de tokens, soit un modèle de prix au plus bas type Pinduoduo.

Liang Wenfeng

Les réseaux sociaux, y compris X, ont immédiatement été envahis par des appels désignant Liang Wenhong comme le bodhisattva cybernétique, le dieu Feng et le saint Liang. Cette émotion ne provient pas du prix bas en soi — DeepSeek est depuis longtemps surnommé le « Pinduoduo de l’IA », avec des services gratuits pour les consommateurs et des tarifs abordables pour les entreprises ; le monde s’est habitué à son prix bas. Mais la difficulté de cette baisse de prix réside dans le fait que l’ensemble de l’IA mondiale est en train d’augmenter ses tarifs.

Des rapports indiquent que Liang Wenhong investira personnellement jusqu'à 20 milliards de yuans dans le record de financement de série A en cours chez DeepSeek, ce qui représente 40 % du montant total levé. La plupart des entreprises, lorsqu'elles lèvent des fonds, priorisent d'abord le renforcement de leur trésorerie pour améliorer leurs résultats financiers, mais Liang Wenhong ne compte pas attirer les investisseurs avec des promesses commerciales ; il reste fidèle à l'open source et à la quête d'une AGI, et cette réduction de prix est bel et bien mise en œuvre. La dernière fois qu'une entreprise a fait preuve d'une telle audace en déclarant qu'elle ne cherchait pas à faire des profits, c'était Pinduoduo : en 2024, l'un de ses cofondateurs a clairement déclaré aux investisseurs lors d'un appel téléphonique : « À partir du T3, nos bénéfices diminueront progressivement et ne rebondiront pas à court terme. À long terme, la baisse de rentabilité est inévitable. » Le cours de l'action a alors chuté brutalement.

Sam Altman prône constamment la démocratisation de l'IA, mais OpenAI avance à grands pas vers le contraire de son nom : CloseAI. Liang Wenhong, en revanche, s'efforce activement de rendre l'IA accessible à tous et à chaque entreprise. Mais Liang Wenhong est-il vraiment un bodhisattva vivant ? Non. Il est un entrepreneur, et l'open source accessible n'est qu'un choix de modèle économique — ce qui est précieux aujourd'hui et deviendra de plus en plus rare à l'avenir.

Car : l'IA devient de plus en plus chère.

Cette semaine, Microsoft a annulé sa licence interne pour Claude Code, car le modèle de facturation basé sur les tokens s'est révélé trop coûteux à supporter. Microsoft avait fortement soutenu OpenAI et fourni à A Société des services cloud Azure, disposant ainsi des ressources cloud que toute entreprise envie, mais les coûts de tokens ont néanmoins pesé lourd. De manière similaire, le CTO d'Uber a rapporté en avril à la direction une situation embarrassante : le budget AI prévu pour toute l'année 2026 a été entièrement dépensé en seulement quatre mois ; 95 % des ingénieurs utilisent mensuellement des outils de programmation IA, et 70 % des commits de code sont générés par l'IA. Ses mots exacts : « Je dois repartir de zéro, car le budget que je pensais nécessaire a déjà été entièrement épuisé. »

Les budgets de jetons des grandes entreprises sont épuisés bien plus rapidement que prévu ; bien que les employés de l'entreprise gaspillent les jetons comme s'ils n'étaient rien, la vraie cause de la tension budgétaire est que l'IA devient plus chère. Les prix des logiciels d'IA aux États-Unis ont augmenté de 20 % à 37 % au cours de la dernière année. Anthropic, OpenAI et Google ont tous discrètement augmenté les prix réels de leurs sorties d'IA au cours des six derniers mois.

Liang Wenfeng

(Source : X)

On pensait autrefois que « plus l'IA est largement appliquée, plus elle devient industrialisée, moins elle coûte, et plus les entreprises sont satisfaites », mais on s'est trompé.

Et cette tendance ne s'inversera pas. Les prix sont déterminés par l'offre et la demande, et non par les coûts, mais la relation entre l'offre et la demande en IA s'est complètement inversée en 2026. Autrefois, les grandes entreprises cherchaient à convaincre les gens d'utiliser l'IA, devaient éduquer le marché et promouvoir la technologie ; l'IA était toujours subventionnée. Combien de thés à la Qwen avez-vous bu ? Et maintenant ? Les gens l'utilisent de plus en plus activement : « après la première gorgée, on ne peut plus s'en passer ». La programmation par IA, les documents par IA, la génération de contenu par IA et même la recherche par IA deviennent de plus en plus répandus. L'ère des subventions pour l'IA est définitivement terminée.

Plus il y a d'utilisateurs, plus la demande augmente, plus les ressources token deviennent tendues, ce qui fait que la pénurie de puissance de calcul se propage du GPU au CPU, au stockage et même à la bande passante. Intel, Micron, SK Hynix, Samsung Electronics, SanDisk ainsi que les entreprises nationales江波龙 et les « deux longs » suivent NVIDIA pour profiter des bénéfices. D'où proviennent les revenus doublés des géants de la semi-conduction en 2026 ? Ils ne viennent certainement pas du cercle fermé d'investissement OpenAI-Oracle-Microsoft, bien sûr ? Ce que ressentent les entreprises n'est encore que le début. Et la séparation stricte entre les offres gratuites et payantes des produits d'IA tels que ChatGPT, Claude, Gemini et DouBao rendra les utilisateurs individuels de plus en plus hésitants.

C’est comme un service de covoiturage : pendant les périodes de folie, vous pouvez prendre gratuitement une voiture de luxe pour vous rendre au travail et en revenir, avec les capitaux qui paient pour vous. Une fois que les utilisateurs ont pris leurs habitudes, les subventions prennent fin et les prix reviennent à leur niveau normal — ceux qui doivent prendre le métro doivent le prendre. Il en va de même pour l’IA. Dans ce contexte où tous les tokens des grands secteurs augmentent, le fait que DeepSeek maintienne ses prix à un niveau bas ne relève plus simplement de la détermination individuelle d’un « bodhisattva cybernétique », mais révèle un pouvoir de tarification inversé : je peux rester si bon marché, fonctionner normalement et maintenir une qualité inébranlable.

Tant que Liang Wenheng le souhaite, DeepSeek n’a absolument pas besoin d’être aussi peu coûteux. Dès lors, les gens commencent à s’inquiéter : DeepSeek deviendra-t-il le Linux de l’ère de l’IA ? Un impact énorme, mais peu de revenus. Linux a apporté une contribution bien plus importante à l’industrie informatique que Windows ou Android (ce dernier reposant lui-même sur le noyau Linux), mais il est open source et n’a pas engendré commercialement de géants comme Microsoft ou Google. L’influence actuelle de DeepSeek est considérable, mais sa capacité commerciale est bien inférieure à celle des trois géants de la Silicon Valley, voire même à celle des trois entreprises nationales Kimi, MiniMax et Zhipu. Classement des revenus des « quatre petits dragons » en 2025 : Zhipu (revenus de 724 millions de yuans en 2025) > MiniMax (revenus d’environ 560 millions de yuans en 2025) > Moonshot (environ 200 millions de yuans) > DeepSeek (inconnu, mais inférieur).

Liang Wenfeng gagne de l'argent avec l'algorithmique basée sur l'IA, il peut investir 20 milliards de yuans dans DeepSeek, mais l'histoire du « financement par l'amour » ne peut pas durer.

Dans le mode open source, d'autres peuvent également effectuer du distillation, du déploiement et un réentraînement, ce qui fait que le avantage technologique de DeepSeek s'amincit de plus en plus. C'est pourquoi vous voyez constamment des nouvelles de « battre des records » : après l'ouverture de GLM-5.1 de Zhipu, il a battu le record mondial sur le benchmark SWE-bench Pro ; MiMo-V2.5-Pro de Xiaomi est devenu le premier modèle open source au monde... Selon un rapport conjoint du MIT et de Hugging Face, au cours de la dernière année, les modèles open source développés en Chine ont représenté 17,1 % des téléchargements mondiaux, dépassant les 15,8 % des États-Unis et occupant la première place mondiale.

Il n'est donc pas étonnant que de plus en plus de voix en Sillicon Valley affirment : il faut absolument créer une version américaine de DeepSeek, et ne pas rester les bras croisés tandis que l'industrie de l'IA revit l'histoire de Shein, Temu ou TikTok. « Si les États-Unis ne voient pas émerger un champion open source, le monde sera aux mains de tout pays capable de produire le modèle open source et le logiciel open source les plus puissants, les plus stables, les moins chers, personnalisables, évolutifs, et adaptés aux besoins personnels et commerciaux. » Les sujets liés à la compétition entre grandes puissances semblent souvent vastes, mais la concurrence sous-jacente est bien réelle.

Derrière la montée de DeepSeek, il y a toujours un récit d’autonomie et de substitution. Le fait que V4 prenne en charge Ascend est une excellente nouvelle ; sous l’impulsion de la puissance de calcul nationale, la compétitivité tarifaire actuelle de DeepSeek n’est encore qu’un avant-goût. Dans son rapport technique, DeepSeek indique que, après le lancement en gros du super-nœud Ascend 950 au second semestre, le prix de V4-Pro sera encore fortement réduit — les meilleurs jours sont encore à venir.

Il y a aussi un avantage en termes de talents AI de haut niveau ; les talents en IA sont chers, voire « luxueux », mais en Chine, ils sont relativement moins coûteux. Le fait que Lei Jun ait recruté Luo Fuli de DeepSeek pour un salaire de 10 millions de yuans est devenu une nouvelle ; en parallèle, Mark Zuckerberg devait dépenser 1 milliard de dollars pour recruter des talents, y compris par des acqui-hires. Mais la différence de qualité entre ce que produisent les personnes recrutées pour 1 milliard de dollars et celles recrutées pour 10 millions de yuans n’est évidemment pas de 700 fois, ce qui signifie que l’écart de prix des talents en IA se traduit en réalité en un écart systémique dans le système de production de tokens.

Une autre compétitivité majeure réside dans le système énergétique, qui constitue la première couche du gâteau à cinq étages d'AI de Jensen Huang.

La fin de l'IA est la puissance de calcul, et la fin de la puissance de calcul est l'électricité. En avril 2026, DeepSeek recrute des ingénieurs senior en exploitation de centre de données et des managers senior de livraison à Ulanqab, en Mongolie-intérieure, ce qui indique qu'il compte construire une usine de tokens dans l'ouest, en transférant son avantage coût de la couche logicielle à la couche physique. La dernière fois, j'ai mentionné Ulanqab dans un article lorsqu'elle a été choisie par Kuaishou pour construire un centre de données : proximité des centrales électriques et climat favorable à la dissipation de la chaleur. De plus, le prix de l'électricité verte dans l'ouest de la Chine est d'environ 0,2 à 0,3 yuans par kWh, soit seulement un cinquième à un quart du prix en Europe et aux États-Unis.

Ce n’est pas seulement l’électricité verte de l’ouest qui est compétitive. Selon les données de l’Agence internationale de l’énergie pour 2025, la capacité totale installée de production d’électricité en Chine dépasse 2300 GW, soit environ 22 % de la capacité mondiale, ce qui en fait la première au monde ; les États-Unis en possèdent environ 1300 GW. Plus important encore, la Chine dispose de la structure électrique la plus complète au monde : thermique, hydraulique, éolienne, nucléaire et photovoltaïque sont tous présents. Les données montrent que le prix industriel de l’électricité en Chine reste stable entre 0,06 et 0,08 USD/kWh, tandis que dans la Californie aux États-Unis, il approche déjà 0,18 USD/kWh, et dans certaines régions d’Allemagne, il dépasse même 0,25 USD/kWh. Cela signifie que pour entraîner un cluster de dix mille cartes, la Chine bénéficie naturellement d’un avantage de coûts de plusieurs dizaines de pourcents par rapport à l’Europe et aux États-Unis.

Dans les coûts d'exploitation des grands modèles d'IA, les coûts énergétiques représentent jusqu'à 60 à 70 % du coût total d'exploitation. Il ne s'agit pas seulement de l'électricité nécessaire au fonctionnement des modèles, mais aussi de la dissipation thermique, qui constitue une part majeure. Même les grands constructeurs d'infrastructures ont directement installé des centres de données sous la mer, exploitant l'énergie éolienne maritime locale pour l'alimentation et utilisant la circulation d'eau de mer pour un refroidissement gratuit. Des projets à grande échelle tels que le transfert d'électricité de l'Ouest vers l'Est et le calcul distribué de l'Est vers l'Ouest démontrent une capacité exceptionnelle de gestion régionale de l'énergie et de la puissance de calcul. Des régions comme le Guizhou, la Mongolie-Intérieure et le Ningxia sont déjà des nœuds centraux du projet « Calcul de l'Est vers l'Ouest » ; les voies pour déplacer les centres de calcul IA vers l'Ouest sont déjà prêtes.

Utiliser l'IA chinoise, c'est essentiellement utiliser une IA formée sur un système énergétique plus compétitif — une IA plus économique et plus accessible. C'est l'une des raisons pour lesquelles les revenus à l'étranger de Kimi, Minimax et autres ont explosé après le Nouvel An chinois : ce n'est pas seulement parce que leurs algorithmes sont plus puissants, mais aussi parce qu'ils bénéficient d'une « superpuissance » sur le prix de l'électricité.

NVIDIA peut définir le prix des performances de calcul haut de gamme, mais DeepSeek et d'autres acteurs maîtrisent la détermination du prix des tokens. Vous pourriez dire que l'IA ne peut pas être bon marché et de qualité. L'IA est effectivement proportionnelle à son coût ; DeepSeek V4 n'a fait qu'éliminer l'écart historique le plus faible entre les modèles open source et closed source. L'équipe officielle reconnaît clairement l'écart objectif par rapport aux modèles de pointe comme GPT, et ce modèle n'est même pas multimodal : il peut reconnaître des images, mais ne peut pas les générer.

Cela n’a toutefois pas empêché la communauté de se tourner vers DeepSeek. La raison : la plupart des scénarios commerciaux réels n’exigent pas d’appeler le modèle le plus puissant du monde à chaque fois. Pour le conseil, le service client, les résumés, la traduction, la complétion de code, les bases de connaissances d’entreprise et les processus automatisés, ce qui compte, ce n’est pas la plus haute intelligence, mais plutôt « suffisamment fonctionnel + suffisamment bon marché + suffisamment stable ». Lorsque le coût d’inférence de DeepSeek V4 représente seulement environ 1 % (Flash) à 11 % (Pro) de celui de GPT-5.5, une entreprise peut, avec le même budget, appeler des dizaines de fois plus de tokens, tester davantage de chaînes de prompts et itérer davantage de flux de travail d’agents — ce qui permet finalement d’obtenir de meilleurs résultats, car l’IA est en soi un jeu de probabilités : si c’est suffisamment bon marché, pourquoi ne pas s’en contenter pour obtenir des résultats ?

Plus l'IA devient chère, plus la rentabilité de DeepSeek devient précieuse, et plus la valeur de l'entreprise DeepSeek augmente — Liang Wenheng et ses investisseurs le comprennent mieux que quiconque.