Le PDG de Qualcomm, Cristiano Amon, vient de chiffrer la vitesse à laquelle le moteur IA s'accélère. Lors de sa conférence keynote à COMPUTEX 2026 à Taipei, Amon a estimé que la génération de jetons IA atteindra 1,27 billion de jetons toutes les 10 secondes d'ici 2030, soit une augmentation d'environ 40 fois par rapport au rythme actuel d'environ 31,7 milliards de jetons toutes les 10 secondes.
Pour être clair : ce ne sont pas des jetons crypto. Ce sont des jetons d'inférence IA, les unités de base de texte, de code et de raisonnement que les grands modèles linguistiques produisent à chaque réponse à une requête. Cette distinction est importante, car l'infrastructure nécessaire pour traiter un tel volume a d'énormes implications pour les fabricants de puces, les fournisseurs de cloud et toute personne développant des produits dépendant de l'IA.
Des réponses à l'autonomie
Les modèles d'IA d'aujourd'hui génèrent principalement des réponses. Vous posez une question, vous obtenez une réponse, peut-être de quelques centaines de jetons de long. Ce qui arrive est différent. L'IA agente, des systèmes qui ne se contentent pas de répondre mais prennent réellement des décisions et effectuent des actions de manière autonome, exigera un débit de jetons considérablement plus élevé.
Amon a présenté cela non pas comme une possibilité lointaine, mais comme un défi d'infrastructure que l'industrie des semi-conducteurs doit résoudre dès maintenant.
Le pari de Qualcomm sur le calcul en périphérie
Si 1,27 billion de jetons sont générés toutes les 10 secondes, faire transiter tout cela à travers des centres de données cloud centralisés serait extrêmement coûteux et douloureusement lent. La solution d’Amon : déplacer autant de traitement AI que possible directement sur l’appareil lui-même. Les plateformes Snapdragon de Qualcomm sont conçues pour gérer les charges de travail d’inférence localement, sur les téléphones, les ordinateurs, les appareils portables et les véhicules, plutôt que d’envoyer chaque requête à une ferme de serveurs.
Lors de démonstrations, Qualcomm a montré que les stratégies hybrides edge-cloud peuvent réduire l'utilisation de jetons jusqu'à 60 % et diviser les coûts par 4. Si la majeure partie du raisonnement IA se produit sur votre téléphone ou votre ordinateur portable, le système n'a besoin d'appeler le cloud que pour les tâches véritablement complexes.
Ce que cela signifie pour les investisseurs
Le traitement Edge AI représente un marché différent avec des gagnants distincts. Qualcomm domine la conception des systèmes sur puce mobiles. Si l'avenir exige une inférence AI sur chaque téléphone, chaque ordinateur, chaque voiture et chaque appareil portable, cela constitue un vent favorable structurel pour l'activité principale de l'entreprise à travers plusieurs lignes de produits.
Les investisseurs doivent également noter ce qu’Amon n’a pas mentionné. Son discours principal n’a fait aucune référence à la technologie blockchain ou à la cryptomonnaie, malgré la terminologie « token » qui génère inévitablement de la confusion. Le chiffre de 1,27 billion fait référence exclusivement à des tokens de calcul IA, et non à des actifs numériques.
