Les revendeurs de jetons à l'ère de l'IA génèrent des millions de revenus mensuels

iconMetaEra
Partager
AI summary iconRésumé
Le relais de jetons est un produit spécifique à l'ère de l'IA, servant de couche intermédiaire entre les utilisateurs et les grands modèles. En regroupant l'accès à près de 20 grands modèles nationaux et internationaux tels que ChatGPT et Claude, il aide les utilisateurs à contourner les restrictions géographiques et à utiliser les services d'IA à un prix inférieur à celui officiel.

Auteur de l'article : Zhan Fangge

Source : Baobian

Revendre des « cryptomonnaies » à l’ère de l’IA : les stations de transfert de jetons s’empressent, mais sont-elles vouées à une courte durée de vie ?

Lorsque vous demandez à une IA de rédiger un rapport hebdomadaire, le « grand modèle » derrière reçoit votre demande, répond à vos informations et comprend le contexte, tout cela étant décomposé en unités de calcul individuelles appelées tokens, traduites en français par «词元».

Chaque interaction avec l'IA est facturée et calculée en fonction des tokens. En tant que « monnaie d'échange » de l'ère de l'IA, le flux de tokens modifie la narration autour de la répartition de la richesse.

Certains ne produisent pas de token, ils se contentent de les déplacer, agissant comme intermédiaires pour réaliser des marges lucratives. Ce métier s’appelle le relais de token.

Certaines entreprises réalisant un chiffre d’affaires mensuel de plusieurs millions de dollars n’ont peut-être qu’un équipe de moins de 20 personnes. « Alors que certains secteurs traditionnels réfléchissent encore à comment générer des bénéfices et réduire les coûts, eux, ils pensent chaque jour à comment éviter les impôts », décrit ainsi un récent arrivant dans le domaine, administrateur d’un site de transfert de tokens.

Au départ, les stations de transfert de jetons existaient principalement pour contourner les restrictions géographiques des grands modèles étrangers, en les connectant de diverses manières au marché intérieur afin de les rendre accessibles aux utilisateurs locaux. Toutefois, à ce jour, de nombreuses stations de transfert exportent également les grands modèles internes efficaces vers les marchés étrangers.

Derrière le carrefour des jetons, il ne s'agit pas seulement de mythes de richesse, mais aussi d'une histoire où la demande précède les règles.

01 L'opportunité du moment

Comment comprendre le relais de jetons ?

Par exemple, pour regarder certains émissions de télévision ou films, vous devrez peut-être souscrire à des abonnements sur différentes plateformes comme Tencent, iQiyi, Youku, Bilibili, etc. Les activer tous revient à une faible utilisation réelle et à un gaspillage d'argent ; dans ce cas, vous souhaiteriez certainement une plateforme partagée d'abonnements vidéo, où un seul abonnement vous permettrait d'accéder librement à toutes ces ressources.

Le carrefour de jetons effectue précisément ce type de « regroupement de grands modèles » ; il utilise diverses méthodes pour obtenir à faible coût des jetons auprès de plusieurs grands modèles, permettant ainsi aux utilisateurs de bénéficier de ChatGPT, Claude, Gemini et autres, même ceux soumis à des restrictions géographiques en Chine ou à l'étranger, pour un coût réduit.

« Si votre utilisation de jetons n’est pas très élevée, les frais générés par l’utilisation d’une station de transfert seront inférieurs à ceux d’un abonnement direct, voire beaucoup plus bas », a déclaré un administrateur de station de transfert à « Bao Bian ». Certains utilisateurs recourent à la station de transfert non seulement pour contourner les restrictions géographiques imposées par les fournisseurs de grands modèles, mais aussi parce que cette méthode est relativement moins chère et leur permet d’essayer davantage de grands modèles différents.

Sur l'interface du carrefour de jetons, jusqu'à près de 20 grands modèles peuvent être appelés ; chaque modèle dispose de méthodes de facturation différentes et de tarifs relatifs variés. Les moins chers permettent d'acheter des millions de jetons pour quelques dizaines de yuans seulement, tandis que, comparativement, un abonnement à ChatGPT Plus coûte 20 dollars par mois.

Le faible seuil technique et les nombreuses pratiques grises en amont poussent de plus en plus de personnes à essayer d'entrer sur ce créneau pour en tirer une part des bénéfices, ce qui a fait chuter le prix du token.

Le Journal économique du 21e siècle avait précédemment rapporté que le prix de sortie de l'API officielle Claude-Opus-4-6 est d'environ 170 yuans pour un million de tokens ; un intermédiaire national a déjà réduit ce prix à la moitié du tarif officiel, et certains petits et moyens sites parviennent même à proposer des tarifs à 20 à 30 % du prix officiel.

En réalité, le commerce des jetons remonte à 2024 ou même plus tôt. « En 2023, certaines personnes avaient déjà commencé à décomposer le modèle de ChatGPT 3.5. La sortie de Claude 3.5 a marqué un saut qualitatif dans le vibe coding (programmation par langage naturel), et depuis lors, les développeurs ont eu un besoin massif de jetons », a déclaré à « Bao Bian » l’expert en contenu AI, McDonald.

Aujourd'hui, la technologie IA s'intègre de plus en plus dans la vie quotidienne et le travail, bouleversant tous les secteurs, et la demande pour les tokens continue d'augmenter fortement.

Auparavant, la CCTV avait rapporté qu'au début de 2025, la quantité moyenne quotidienne d'appels de jetons en Chine n'était que de 7 billions, passant à 30 billions au milieu de l'année, et dépassant 100 billions à la fin de 2025. Au début de 2026, la quantité moyenne quotidienne d'appels de jetons est déjà arrivée à 140 billions.

Cela ne prend en compte que les appels selon les canaux officiels ; si l'on ajoute les demandes d'appels de modèles à l'étranger, la consommation de tokens ne fera que augmenter. Ainsi, aujourd'hui où même les étudiants universitaires veulent utiliser les meilleurs modèles pour réviser leurs thèses, des intermédiaires de tokens ont surgi comme des champignons après la pluie.

Surprenant, la barrière technique pour le relais de jetons en lui-même n'est pas élevée.麦当表示,vibe coding大大降低了搭建中转站的门槛,站长只需要略懂技术就能实现站点部署。

« Il existe deux ensembles clairs de solutions open source disponibles : l’une s’appelle sub2 API, l’autre New API », a déclaré McDonald. « Vous n’avez qu’à acheter un serveur, puis dire à l’IA : “Ce projet est intéressant, aide-moi à le déployer sur quel serveur”, et l’IA le fera pour vous. »

Avec l'exemple de la nouvelle API, il s'agit d'une solution complète intégrant la conversion de protocoles, la gestion des canaux, la facturation et la gestion de l'interface administrateur utilisateur, accessible à la demande.

La barrière technique n'est pas élevée, mais le commerce de relais de jetons est séduisant et dangereux.

02 Chaîne grise

Pour devenir une plateforme de transfert de jetons, il faut travailler en amont de la chaîne de valeur, c’est-à-dire « comment appeler des grands modèles étrangers à moindre coût ».

Le modèle classique consiste en un mode de vente en gros et au détail de jetons. Les principales plateformes proposent généralement des abonnements développeurs (Coding Plan), incluant un nombre fixe d'appels gratuits, avec un tarification progressive pour les dépassements. Un intermédiaire peut acheter en gros plusieurs abonnements Coding Plan, regrouper les quotas dans un pool de comptes, puis les revendre à un prix légèrement inférieur à celui de l'API officielle.

Par exemple, l'API officielle vend à 1 yuan/10 000 tokens, le coût réparti du plan Coding Plan n'est que de 0,2 yuan/10 000 tokens, et le prix de revente du relais est de 0,5 yuan, soit une marge brute de 60 %.

Cette méthode est très conforme, mais repose sur un volume élevé pour générer des bénéfices.

Le chef de la station de transfert mentionnée ci-dessus a déclaré à « Bao Bian » qu'autour de 2024, les fabricants de grands modèles à l'étranger étaient encore en phase d'élargissement de leur marché et offraient gratuitement des quotas d'utilisation de grands modèles à certaines startups de produits AI, dans le but de favoriser une collaboration continue à terme au niveau des applications.

« Il y a donc un groupe de personnes qui, sous le prétexte de créer des startups basées sur l’IA, enregistrent en masse ce type d’entreprises dans une ville américaine, dans le seul but d’obtenir les quotas gratuits de ces fournisseurs, puis d’utiliser des techniques pour les transférer gratuitement au sein du pays », a déclaré le responsable de ce centre de transfert. Cela pourrait bien être la forme initiale des centres de transfert de tokens en Chine, ainsi que l’une des méthodes les moins coûteuses pour appeler des grands modèles à l’étranger.

Le modèle économique du token relay station fonctionne aujourd'hui avec une multitude de pratiques grises, la plus typique étant le « reverse ».

Par exemple, des logiciels comme Windsurf et Cursor intègrent déjà l'accès à des grands modèles tels que Claude. Certains relais effectuent une ingénierie inverse pour connecter ces grands modèles à leur propre relais et les mettre à disposition des utilisateurs. « C’est comme voler de l’eau et de l’électricité : on branche son propre tuyau sur le réseau public pour utiliser gratuitement l’eau et l’électricité fournies par les canaux officiels », a déclaré le responsable de ce relais.

De plus, en raison des forfaits d'abonnement individuel proposés par des entreprises comme GPT et Claude, certains intermédiaires obtiennent d'abord un grand nombre de comptes d'abonnement individuel, puis, par ingénierie inverse, décomposent les capacités d'appel de ces comptes pour les revendre à un plus grand nombre d'utilisateurs.

Au cours de ce processus, l'obtention de lots de numéros de téléphone est très probablement liée à des activités grises telles que le vol de cartes de crédit ou d'identifiants Apple. De plus, le routage peut entraîner une limitation des comptes et une dégradation de l'expérience utilisateur.

Pour les utilisateurs, bien que le relais de jetons semble pratique et économique, les risques qu'il comporte peuvent être très élevés. Par exemple, les utilisateurs sont souvent payants à l'avance et peu sensibles à la consommation de jetons ; le relais pourrait discrètement prélever des frais supérieurs à ceux convenus. Toutefois, Xiao Zhang, un professionnel du secteur de l'IA, a indiqué à Bao Bian que les utilisateurs peuvent facilement détecter ces pratiques s'ils le souhaitent ; seuls les relais qui ne cherchent pas à construire une bonne réputation les adoptent.

En outre, « vendre de la viande de chien sous couvert de mouton » est également très courant : « Remplacer un bon modèle par un modèle bon marché, c’est ce qu’on appelle le dilution », explique Ma Dang. Le plus grand risque provient des données. Ma Dang indique que (l’inverse) consiste techniquement à transmettre les questions envoyées par les utilisateurs au grand modèle, puis à intercepter les réponses du grand modèle pour les renvoyer aux utilisateurs.

Pendant tout le processus, les données utilisateur ne sont pas seulement entièrement sous le contrôle du point de transit, mais sont également transmises sur le site web, offrant aux pirates une opportunité d'attaquer.

Xiao Zhang a indiqué que la plupart des stations de transfert indiquent s'il s'agit d'un « inverse » après avoir appelé le grand modèle, mais même si c'est marqué comme « claude-officially », il dépend principalement de la conscience de l'administrateur du site de savoir s'il s'agit vraiment d'un service API fourni officiellement par le fabricant du grand modèle.

Le journal 21st Century Business Herald avait précédemment rapporté que de nombreux responsables de centres de transit avaient été interrogés sur la possibilité de vendre des données utilisateur, et qu'il était révélé que plusieurs grandes entreprises du secteur recourent à l'achat de données pour entraîner leurs modèles.

En tant que professionnel de l'IA, Xiao Zhang connaît ces risques ; il n'utilise le point de transfert que pour une petite partie de son travail, comme modifier du code ou des documents, et ne révèle jamais les données ou mots de passe essentiels. Le reste de son travail est effectué à l'aide des grands modèles nationaux fournis par l'entreprise.

Pour la grande majorité des utilisateurs d'autres secteurs, la capacité de comprendre les risques liés aux données peut en elle-même constituer une barrière.

03 Différenciation du secteur

D'un côté, ce métier qui a longtemps évolué dans une zone grise a été étiqueté comme à haut risque : en mai 2026, un administrateur de station de transfert d'IA nationale a été détenu criminellement pendant 37 jours par la police pour avoir illégalement effectué un reverse engineering et revendu des ressources d'interfaces IA à bas prix.

D'autre part, toujours en mai, l'entrée successives de deux personnalités très médiatisées a mis le relais de jetons à l'avant-scène.

Le 1er mai, le célèbre acteur du monde des cryptomonnaies, Sun Zhen, a annoncé sur les réseaux sociaux la création de son « plus puissant centre de transfert AI de l'histoire » — B.AI, soulignant la connexion blockchain, les paiements entièrement anonymes, l'immuabilité et les prix les plus bas du marché. Toutefois, B.AI exige des paiements en cryptomonnaies et contourne délibérément les procédures de vérification d'identité, suscitant de nombreuses questions en matière de conformité.

Le même jour, Fu Sheng, président et PDG de Cheetah Mobile, a officiellement lancé EasyRouter. Rapidement, l'entreprise a publié un communiqué sur son site web indiquant qu'elle ne fournit pas de services en Chine continentale et qu'elle propose des remboursements ; la description d'EasyRouter par Fu Sheng est passée de « station de transfert » à « passerelle de modèle niveau entreprise / couche de routage ».

Le site web indique que ses API proviennent d'achats directs auprès de fournisseurs de services cloud et de plateformes d'IA. En s'appuyant sur les principaux fournisseurs de cloud et plateformes d'IA, il propose un service de distribution de puissance de calcul IA conforme, stable et certifié traçable.

En d'autres termes, EasyRouter affirme que ses fournisseurs en amont sont entièrement conformes et n'ont pas vendu à des utilisateurs d'autres régions contre la volonté des entreprises étrangères de modèles de grande taille.

Aujourd'hui, les fournisseurs de grands modèles en amont font face à une réglementation de plus en plus stricte. Le 12 juin 2026, heure locale, Anthropic a annoncé avoir reçu une directive du gouvernement américain, obligeant l'entreprise à imposer des restrictions d'accès totales à ses deux modèles d'IA les plus avancés, Fable 5 et Mythos 5, s'appliquant à toutes les institutions et particuliers hors des États-Unis.

Dans un contexte où la conformité devient de plus en plus stricte, des entreprises nationales comme EasyRouter commencent également à explorer la conformité de ce métier.

En réalité, le commerce de tokens conformes n'est pas compliqué. En 2023, OpenRouter a été créé aux États-Unis en tant que plateforme d'agrégation de plusieurs fournisseurs de grands modèles, qui bénéficient de volumes de requêtes de tokens suffisamment élevés pour obtenir des prix plus avantageux auprès de la plateforme, puis les revendent aux utilisateurs. En termes simples, il s'agit d'un modèle de vente en gros puis au détail de tokens.

Outre le rôle de « grossiste », il existe d'autres opportunités entièrement B2B avec un risque de non-conformité moindre. Le responsable de la station de transfert mentionnée a déclaré à « Bao Bian » qu'il ne gagnait pas d'argent grâce à l'activité B2C de la station de transfert, mais principalement en aidant les clients à déployer des stations de transfert. Par exemple, de nombreux chefs d'entreprise souhaitent que leurs employés puissent utiliser de meilleurs modèles d'IA et sont prêts à payer pour faire installer une station de transfert à caractère non lucratif au sein de leur entreprise.

Certains tentent également d’offrir des services périphériques aux stations de transfert, comme la facturation standardisée en cryptomonnaies et la gestion financière par réconciliation intelligente. Une personne impliquée dans ce domaine a déclaré à « Bao Bian » que, bien que les petites et moyennes stations de transfert de tokens en Chine n’aient généralement pas de besoins en règlement en cryptomonnaies, de nombreuses grandes stations de transfert de tokens à l’étranger en ont besoin ; selon les normes de l’industrie, la commission est d’environ 1 %.

Il a également indiqué que ces grands relais de jetons ne se contentent pas d'acheminer les grands modèles étrangers vers la Chine, mais font également de l'exportation de grands modèles chinois. « DeepSeek, DouBao et certains modèles du groupe Alibaba présentent un avantage majeur en termes de prix ; en ne les vendant pas aux États-Unis, mais sur d'autres marchés, ils bénéficient d'un avantage absolu. »

Ainsi, le carrefour de jetons devient une tranche honnête dans le flot d'IA, enregistrant fidèlement comment les besoins réels circulent et changent de direction.

« Le code lui-même n’a pas beaucoup de valeur à cette époque », a déclaré Xiao Zhang.

De même, ce qui détermine réellement la durabilité de ce métier de relais de jetons ne réside pas dans le code. Pendant la phase de croissance sauvage de l'industrie, celui qui contrôle les sources d'approvisionnement domine le marché ; mais à mesure que les fabricants en amont renforcent leur lutte contre les pratiques illégales, les marges bénéficiaires soutenues par des pools de canaux inversés et des sources de cartes noires ne feront que se réduire.

Au fond, l'apparition du relais de jetons n'a probablement pour but que de combler un vide du marché pendant cette période particulière, en étant un produit temporaire de la vague d'IA. Si un jour les barrières technologiques de l'IA sont levées, ce sera peut-être le début de la disparition des relais.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.