Le modèle de revenu basé sur les jetons d'OpenAI et d'Anthropic sera examiné dans les documents d'offre publique

CoinDesk rapporte :

Selon les médias étrangers, à mesure que OpenAI et Anthropic déposent respectivement des demandes d'introduction en bourse confidentielles, le mot « token » apparaîtra fréquemment dans les prospectus de Wall Street. Il ne s'agit pas d'une crypto-monnaie, mais de l'unité de base utilisée par les modèles d'IA pour traiter le texte, les images et l'audio, et constitue un critère essentiel de facturation pour les entreprises de grands modèles.

Pour les investisseurs traditionnels, la difficulté ne réside pas dans la compréhension de ce qu’est un token, mais dans la manière de convertir l’utilisation des tokens en revenus, coûts et bénéfices. L’article estime que cela deviendra un obstacle majeur à la lecture des documents d’offre publique futurs d’OpenAI et d’Anthropic.

Le token devient l'unité de facturation

Actuellement, les entreprises de grands modèles facturent principalement de deux manières : soit par abonnement, en proposant des services avec un quota de tokens aux particuliers ou aux entreprises ; soit selon l'utilisation de l'API, en facturant en fonction du nombre de tokens en entrée et en sortie. Les utilisateurs doivent payer supplémentairement s'ils dépassent leur quota.

À titre d'exemple, le site d'OpenAI indique que le prix d'entrée pour GPT-5.5 est de 5 dollars pour 1 million de tokens, et le prix de sortie est de 30 dollars pour 1 million de tokens. Anthropic propose un prix similaire pour Claude Opus 4.8, avec un coût de sortie de 25 dollars pour 1 million de tokens.

L'article affirme que ce système ressemble au passage des débuts du cloud computing d'un modèle de licence logicielle à un modèle d'abonnement. La différence réside dans le fait que les entreprises d'IA transforment désormais directement la consommation de puissance de calcul en production de tokens, à partir de laquelle elles génèrent des revenus.

SpaceX et Cerebras en démonstration pilote

Avant la publication des prospectus d'OpenAI et d'Anthropic, le marché avait déjà pu anticiper la manière dont les tokens seraient divulgués à partir des documents de Cerebras et de SpaceX. Selon CNBC, le terme « token » est mentionné 23 fois dans le prospectus de Cerebras et 62 fois dans les documents de SpaceX, avec une entrée spécifique dans le glossaire.

SpaceX définit le token dans le fichier comme l'unité de base traitée et générée par le modèle d'IA pour le texte, les images et d'autres contenus, ainsi que l'unité de données consommée et produite lors de la lecture, de l'inférence et de la sortie du modèle.

Cependant, l'article souligne que l'importance financière actuelle du token pour SpaceX reste limitée. Environ 70 % des revenus du premier trimestre de l'entreprise proviennent de Starlink, 13 % de ses activités spatiales et environ 17 % de ses activités d'IA. Toutefois, le département d'IA continue de générer des pertes et absorbe la majeure partie des dépenses en capital.

En comparaison, Cerebras s'approche davantage de l'échantillon « infrastructure purement AI ». En tant qu'entreprise de puces, sa logique consiste à aider ses clients à générer des tokens plus rapidement. L'entreprise indique dans son prospectus qu'une capacité d'inférence plus rapide améliore l'efficacité de la production d'IA, tandis que la consommation de tokens continue de croître fortement, ce qui profitera directement aux puces haute performance.

Le point essentiel reste de savoir si les revenus couvrent les coûts.

L'article affirme que la vraie question n'est pas à quelle vitesse le nombre de tokens augmente, mais si ces tokens apporteront finalement un retour suffisant. Scott Breitenother, PDG de l'entreprise de start-up AI Kilo Code, déclare que la taille des tokens peut servir d'indicateur directionnel, mais ce qui intéresse finalement les entreprises, c'est l'efficacité réelle et le retour sur investissement.

Google a commencé à divulguer les tokens comme indicateur de performance. Son PDG, Sundar Pichai, a déclaré lors de la conférence téléphonique des résultats du mois d'avril que le nombre de tokens traités par minute par les clients via l'API directe a dépassé 16 milliards, contre 10 milliards au trimestre précédent. Au cours de la dernière année, 330 clients cloud ont traité plus de 1 billion de tokens, et 35 en ont traité 10 billions.

Mais l'article souligne que la situation de Google ne peut pas être directement appliquée à OpenAI et Anthropic. Le premier vend des infrastructures cloud et peut directement bénéficier de la croissance de la demande en puissance de calcul ; les deux derniers doivent payer des coûts élevés aux fournisseurs de cloud et aux fabricants de puces pour faire fonctionner leurs modèles.

Cela signifie que la viabilité du modèle économique d’OpenAI et d’Anthropic dépend non seulement de la croissance de l’utilisation des tokens, mais aussi du fait que les revenus générés par unité de token suffisent à couvrir les coûts des infrastructures et de la puissance de calcul fournis par Nvidia, Cerebras et les fournisseurs de services cloud. L’article estime que, pour l’instant, ce bilan est loin d’être équilibré.