À mesure que les agents IA sont déployés dans divers scénarios complexes tels que les flux de travail d'entreprise, la production automatisée et l'exécution autonome, l'industrie mondiale de l'IA entre officiellement dans une nouvelle phase passant de la « réaction passive » à l'« exécution autonome ». Le cœur de la concurrence sectorielle a désormais cessé de se limiter à la simple comparaison des paramètres des grands modèles pour se concentrer sur la capacité d'exécution concrète, et une puissante capacité de raisonnement logique constitue la base fondamentale de ce changement.
La transformation des modèles d'application entraîne un changement fondamental de la demande en infrastructure de calcul en amont : le centre de consommation de calcul passe continuellement de l'entraînement des modèles vers l'inférence opérationnelle, une tendance irréversible. Toutefois, le système centralisé de calcul dominant, face à des demandes d'inférence massives, fréquentes et fortement fluctuantes, révèle des problèmes tels qu'un coût d'exploitation élevé, une capacité d'extension élastique limitée et une instabilité du service. L'ensemble de l'industrie de l'IA fait face à un goulot d'étranglement au niveau de l'offre de calcul.
Le 17 juin, l'écosystème décentralisé établi BitTorrent a lancé officiellement son produit stratégique, BTTInferGrid, ciblant le secteur de l'inférence IA, et construisant un réseau de puissance de calcul décentralisé. Placé sur une architecture distribuée décentralisée, cette plateforme agrège efficacement les ressources de calcul GPU inutilisées dispersées dans le monde entier, en éliminant les barrières entre les fournisseurs de ressources et les développeurs d'IA, et en offrant un service de puissance de calcul pour l'inférence IA ouvert, facile à intégrer, dont les résultats peuvent être vérifiés sur la chaîne, et facturé de manière flexible selon la consommation.
Grâce à ses avantages technologiques décentralisés, BTTInferGrid ne se contente pas de combler les lacunes des centres de calcul traditionnels en matière de haute concurrence et de fluctuations de charge, mais réalise également une avancée majeure du côté de l'offre de calcul,重构ant entièrement la logique d'allocation et de circulation des ressources dans l'écosystème de calcul.
Dans le même temps, BTTInferGrid est un produit stratégique dérivé de la mise à niveau du service existant BTFS de BitTorrent ; il s'agit non seulement d'une extension clé des compétences de planification de ressources décentralisées de BitTorrent, acquises sur plusieurs années, du domaine du stockage vers celui du calcul, mais aussi d'un coup décisif dans son déploiement sur le secteur de l'IA décentralisée.
La structure de la demande en puissance de calcul passe de l’« entraînement » à l’« inférence » : BTTInferGrid restructure la fourniture de puissance de calcul pour l’inférence IA de manière décentralisée
BTTInferGrid vise à restructurer le système d'approvisionnement en puissance de calcul en utilisant un modèle décentralisé, afin de résoudre les problèmes de coûts excessifs et de pénurie d'approvisionnement en puissance de calcul pour l'inférence IA, tout en réduisant les coûts, en améliorant l'efficacité et en augmentant l'efficacité de l'inférence des grands modèles, offrant ainsi à l'industrie une infrastructure de puissance de calcul hautement performante, résiliente et rentable.

Si l'année 2024 à 2025 a été marquée par une course aux paramètres dominée par la « guerre des mille modèles » et des clusters de milliers de cartes dans l'industrie de l'IA, alors en 2026, avec le déploiement à grande échelle des AI Agents, l'IA entre officiellement dans l'ère de la « découverte », caractérisée par une explosion des applications à grande échelle. L'inférence en IA est l'étape clé qui permet de concrétiser la valeur des modèles, en transformant des « modèles entraînés » en applications concrètes, en valeur commerciale et en services quotidiens. En résumé, l'entraînement consiste à « apprendre à l'IA », tandis que l'inférence consiste à « faire fonctionner l'IA dans la pratique » — par exemple, une voiture autonome identifiant un panneau d'arrêt sur une route qu'elle n'a jamais empruntée constitue un exemple typique d'inférence. La capacité d'inférence détermine directement l'expérience utilisateur, les coûts opérationnels et la valeur commerciale des produits d'IA.
Il est largement reconnu dans l'industrie que plus de 70 % des ressources de calcul seront dédiées à des scénarios d'inférence à l'avenir. Oracle avait anticipé que le marché de la puissance de calcul pour l'inférence finirait par dépasser celui de la formation. Le académicien de l'Académie chinoise d'ingénierie Zheng Weimin a également souligné que la majorité actuelle de la puissance de calcul est consommée par les interactions quotidiennes entre les utilisateurs et les grands modèles. En termes de structure des coûts, dans les dépenses d'inférence des grands modèles, les coûts humains ne représentent que 3 %, les données 2 %, tandis que la puissance de calcul représente 95 % ; les coûts de puissance de calcul pour les applications de pointe sont considérables : le coût quotidien d'inférence de ChatGPT s'élève à environ 700 000 dollars américains, et celui de DeepSeek V3 atteint 87 000 dollars américains.
Lorsque la demande en puissance de calcul pour l'IA s'est étendue des entraînements centralisés de quelques géants technologiques à des scénarios de raisonnement commercial impliquant des millions de développeurs dans divers secteurs, les critères d'évaluation de l'infrastructure sous-jacente ont également évolué. À l'ère de l'entraînement, les développeurs se concentraient principalement sur l'échelle et l'efficacité de la puissance de calcul centralisée ; à l'ère du raisonnement, les services d'IA sont directement destinés à des milliards d'utilisateurs finaux, et les milliards d'interactions quotidiennes génèrent une consommation énorme de puissance de calcul, ce qui a déplacé l'attention des développeurs vers le coût par appel, la vitesse de réponse et la stabilité du service. Aujourd'hui, la fourniture de puissance de calcul, le coût d'appel et la disponibilité du service sont devenus les critères fondamentaux pour évaluer l'infrastructure IA, ainsi que les facteurs déterminants pour le déploiement réussi des applications IA.
Cependant, face à une demande en calcul d'inférence en croissance exponentielle, les faiblesses des systèmes centralisés de puissance de calcul deviennent de plus en plus évidentes : les loyers des GPU continuent d'augmenter, les services des plateformes connaissent fréquemment des pannes, et de nombreuses applications d'IA sont contraintes de fermer en raison du coût du calcul. Ces problèmes se manifestent clairement dans les trois domaines suivants :
Premièrement, la capacité de planification de la puissance de calcul manque de souplesse et ne peut pas s'adapter aux variations de pointe et de creux du trafic, plongeant les acteurs dans un dilemme entre coûts et stabilité : bien que les principales entreprises d'IA et les fournisseurs de cloud augmentent continuellement leurs investissements dans les infrastructures de calcul, la demande en inférence augmente rapidement et présente des caractéristiques marquées de pointe et de creux — le volume de requêtes peut exploser de plusieurs dizaines de fois pendant les heures de bureau ou les pics marketing, puis chuter brusquement pendant la nuit. Les centres de données centralisés, dépourvus de capacité de planification dynamique, peinent à s'adapter à ces variations : si l'infrastructure est dimensionnée pour la pointe, les coûts d'amortissement pendant les périodes creuses sont excessifs ; si elle est dimensionnée pour la moyenne, les services connaissent des interruptions pendant les pics, plongeant les opérateurs dans un dilemme entre « coûts élevés » et « faible stabilité ». Par ailleurs, les ressources de calcul centralisées doivent supporter des coûts supplémentaires liés à la construction des centres de données, à l'électricité, à la maintenance et aux profits commerciaux, ce qui se traduit finalement par des coûts de calcul très élevés, réduisant considérablement l'espace d'expérimentation pour les petites équipes innovantes. Le marché a un besoin urgent d'une solution nouvelle combinant avantages coûts et capacité de planification élastique.
Deuxièmement, les prix de location des GPU continuent d'augmenter, et ces coûts élevés entravent la mise en œuvre de l'innovation chez les petites et moyennes entreprises ainsi que les développeurs : bien que les grands modèles open source (comme Qwen, DeepSeek, etc.) aient abaissé les barrières à l'entrée dans le domaine de l'IA, le déploiement et l'exécution de ces modèles dépendent toujours d'une puissance d'inférence stable, abordable et facilement accessible. Or, en réalité, les coûts de location des GPU ne cessent d'augmenter : par exemple, le prix horaire d'une carte H100 courante est passé de 1,70 $ en octobre 2025 à 2,35 $ en mars 2026, soit une hausse de près de 40 % en six mois. Ces coûts élevés découragent de nombreux développeurs individuels et PME disposant de solutions de qualité, les plongeant dans une situation de « modèle disponible, mais pas de puissance de calcul », ce qui freine sérieusement la vitalité innovante et le développement à grande échelle de l'industrie de l'IA.
Troisièmement, une grande quantité de ressources GPU inutilisées à l'échelle mondiale ne sont pas efficacement exploitées, créant un déséquilibre marqué entre l'offre et la demande : en contraste frappant avec la pénurie de puissance de calcul sur le marché, d'immenses ressources de calcul GPU hautement performantes, inutilisées, sont dispersées dans des appareils personnels, des laboratoires universitaires, de petites salles serveurs et des infrastructures laissées par la transition hors des cryptomonnaies. En l'absence de canaux d'accès standardisés et d'un moteur de planification efficace, ces ressources de calcul ne peuvent pas accéder au marché principal de l'inférence, créant une situation paradoxale où la demande subit une pénurie aiguë de cartes tout en parallèle, l'offre connaît une inertie de puissance de calcul. Il existe un énorme potentiel d'amélioration de l'utilisation des ressources, et le déséquilibre entre l'offre et la demande nécessite une solution urgente.
Ainsi, le marché actuel de la puissance de calcul pour l'inférence IA fait face à trois défis structurels : d'un côté, l'offre centralisée ne parvient pas à concilier coût et élasticité ; de l'autre, les loyers de calcul continuent d'augmenter, étouffant l'innovation en IA ; et en parallèle, d'immenses ressources GPU inactives restent longtemps inutilisées. Face à ces défis industriels, BTTInferGrid, grâce à sa technologie décentralisée, propose une solution innovante pour résoudre le déséquilibre entre l'offre et la demande de puissance de calcul.
BTTInferGrid vise à connecter efficacement, de manière décentralisée, les ressources GPU inutilisées réparties dans le monde entier avec une multitude de développeurs d'IA, brisant ainsi fondamentalement le monopole et les goulets d'étranglement des centres de calcul centralisés. D'une part, la plateforme intègre les capacités GPU inutilisées dispersées pour construire une infrastructure de calcul ouverte et partagée ; d'autre part, elle établit un canal de connexion entre l'offre et la demande, éliminant les barrières d'accès et les boîtes noires de tarification du modèle centralisé traditionnel. En s'appuyant sur les mécanismes d'incitation et de coordination de DePIN, BTT InferGrid est en mesure de fournir en continu des capacités d'inférence à haut rapport qualité-prix, résolvant ainsi à la source les problèmes majeurs liés au coût élevé et à la pénurie de calcul, libérant véritablement l'efficacité et la valeur commerciale de l'inférence des grands modèles.
BTTInferGrid : Construire un réseau décentralisé de puissance de calcul orienté vers les scénarios d'inférence IA, avec trois avantages qui redéfinissent le mécanisme d'allocation de puissance de calcul
BTTInferGrid cible clairement et précisément la construction d'un réseau décentralisé de puissance de calcul dédié aux scénarios d'inférence IA, reliant l'offre mondiale de puissance GPU inutilisée à la demande en inférence IA, et offrant un service mondial de puissance de calcul IA ouvert, vérifiable et facturé à l'utilisation.
Plus précisément, BTTInferGrid s'appuie sur le mécanisme de réseau DePIN pour faire correspondre précisément l'offre de puissance de calcul à la demande explosive en inférence IA, créant une valorisation réciproque des deux côtés de l'offre et de la demande :
· Dans l'offre de puissance de calcul, nous agrégons efficacement les ressources GPU inutilisées et fragmentées à l'échelle mondiale pour construire une infrastructure de calcul ouverte et partagée. En tirant parti des mécanismes d'incitation et de planification intelligente de DePIN, nous offrons d'une part aux détenteurs de puissance de calcul un canal de revenus à faible seuil et durable, transformant ainsi les GPU inutilisés et « endormis » en « actifs liquides » ; d'autre part, nous garantissons la stabilité de la puissance de calcul et son élasticité en matière de mise à l'échelle, afin de créer un service de traitement informatique global hautement rentable, extensible et sécurisé.
· Du côté de la demande en puissance de calcul, BTTInferGrid offre un service de calcul global accessible, vérifiable sur chaîne et facturé à l'utilisation, destiné aux développeurs d'IA du monde entier. Contrairement aux prix exorbitants des fournisseurs de cloud centralisés, BTTInferGrid présente un avantage de coût extrême et une capacité d'extension élastique, permettant aux petites et moyennes équipes d'innovation ainsi qu'aux développeurs indépendants de réduire leurs coûts d'expérimentation, d'achever efficacement la validation de leurs produits et leurs itérations commerciales, tout en renforçant à son tour l'écosystème d'offre de puissance de calcul en amont.


Ainsi, BTTInferGrid répond concrètement au besoin pressant des développeurs d'IA en phase d'application pour une puissance de calcul peu coûteuse et hautement élastique, tout en ouvrant une voie durable de valorisation pour les ressources matérielles inutilisées à l'échelle mondiale.
Plus important encore, la plateforme BTTInferGrid établira avec succès une roue de croissance positive autonome : les nœuds GPU inactifs s'étendront en continu, réduisant constamment le coût des capacités d'inférence et attirant davantage de développeurs ; la demande du marché augmentera sans cesse, incitant davantage d'acteurs mondiaux de l'approvisionnement en puissance de calcul à rejoindre l'écosystème. BTTInferGrid reconstruit l'approvisionnement en puissance de calcul selon un modèle décentralisé, transformant la puissance d'IA spécialisée, rare et coûteuse, en une nouvelle infrastructure publique d'IA universelle et accessible à la demande.
En termes d'avantages de performance du produit, la plupart des plateformes GPU décentralisées actuelles sur le marché rencontrent des problèmes tels qu'un seuil d'accès à la puissance de calcul élevé, une fiabilité insuffisante des services et un modèle économique difficile à maintenir à long terme. BTTInferGrid effectue des optimisations dès l'architecture de base, réalisant une avancée complète sur trois dimensions : agrégation de la puissance de calcul, vérification des services et durabilité du système économique, créant ainsi une compétitivité unique. Les avantages précis sont les suivants :
1. Réseau d’approvisionnement en puissance de calcul à accès ouvert, regroupant rapidement les ressources GPU inutilisées à l’échelle mondiale : les barrières à l’entrée des services de calcul cloud traditionnels sont élevées (nécessité d’un centre de données conforme, d’une adresse IP publique fixe, de commutateurs coûteux, etc.). BTTInferGrid crée un véritable réseau d’approvisionnement en puissance de calcul ouvert à tous ; toute entité ou individu disposant de ressources de calcul inutilisées, telles que des GPU, peut se connecter sans friction dès lors qu’il respecte les paramètres de performance de base (capacité de mémoire vidéo, puissance de calcul de référence) et les exigences de stabilité réseau. Cette conception réduit considérablement les barrières à l’entrée pour les fournisseurs de puissance de calcul, permettant une aggregation rapide et massive des ressources GPU inutilisées à l’échelle mondiale.
2. Qualité de service et comportement des nœuds vérifiables : résolution du défi de la confiance décentralisée — le principal problème du calcul décentralisé réside dans la fiabilité — comment empêcher les mineurs de simuler des cartes graphiques haut de gamme avec des cartes bas de gamme ? Comment garantir que les résultats d’inférence sont authentiques et fiables ? BTTInferGrid établit une boucle fermée vérifiable par croisement grâce à l’ordonnancement des tâches (distribution intelligente), la vérification par défi (vérification cryptographique aléatoire), l’évaluation par consensus (score de réputation dynamique) et la coordination sur chaîne (contrats intelligents avec récompenses et sanctions), améliorant ainsi efficacement la fiabilité des services d’inférence.
3. Modèle économique piloté par la demande pour créer un écosystème durable : Les premiers projets DePIN sont souvent tombés dans une spirale mortelle caractérisée par une émission élevée de jetons pour attirer les nœuds à miner de manière aveugle, mais qui a conduit à une inflation des jetons, une chute des prix et le départ des nœuds en raison du manque de demande réelle. BTTInferGrid a dès le départ établi l’objectif de construire un écosystème économique piloté par la demande réelle — en s’appuyant sur les appels réels d’inférence et la performance des nœuds comme base principale d’incitation. Seuls les fournisseurs de puissance de calcul obtiennent une part des revenus principaux et un bonus de réputation lorsque les développeurs d’IA paient réellement pour appeler les modèles. Cette conception favorisera une croissance équilibrée et durable entre l’offre et la demande du marché, assurant le développement à long terme et sain de l’écosystème réseau.
En résumé, de la grille d'offre ouverte permettant aux GPU inutilisés du monde entier répondant aux normes de performance de s'interfacer sans friction, jusqu'à la ligne de défiance vérifiable tout au long du processus construite sur quatre boucles fermées — planification des tâches, vérification des défis, notation par consensus et récompenses/punitions sur chaîne — en passant par l'abandon total des bulles spéculatives et l'ancrage des incitations sur un modèle économique piloté par la demande réelle d'inférence IA, BTTInferGrid redéfinit le mécanisme d'allocation des ressources de calcul selon trois dimensions : regroupement des ressources, fiabilité des services et répartition de la valeur.
BTTInferGrid développera progressivement un nouvel écosystème de puissance de calcul piloté par des besoins réels
BTTInferGrid n'est pas simplement une « agrégation de puissance de calcul », mais un réseau de calcul décentralisé sophistiqué intégrant la planification et l'exécution de tâches d'inférence IA, la correspondance et la connexion intelligentes entre l'offre et la demande de puissance de calcul, ainsi que la coordination et le règlement des ressources sur chaîne.
Dans l'écosystème décentralisé de puissance de calcul de BTTInferGrid, tous les participants forment trois rôles clés autour de l'« offre, de l'utilisation et de la vérification » de la puissance de calcul :
Fournisseurs de puissance de calcul (mineurs) : mettent à disposition des ressources GPU inutilisées pour exécuter des tâches d'inférence IA. Le système attribue automatiquement des récompenses en fonction du travail effectif vérifié, de la qualité de réalisation des tâches et de la note de performance dynamique.
· Demandeurs de puissance de calcul (développeurs d'IA) : BTTInferGrid propose une interface API standardisée et unifiée, permettant aux développeurs d'accéder à des ressources GPU distribuées à l'échelle mondiale.
· Guardians of the Network (Validators) : Participate in a decentralized verification and scoring system, auditing and randomly challenging miners' computational performance to identify anomalous behavior and maintain network service quality. Meanwhile, validators earn rewards for preserving network integrity, collectively ensuring fairness and trustworthiness of the network.
En résumé, BTTInferGrid offre aux développeurs d'IA un service d'inférence AI plus économique, hautement évolutif et sécurisé, atténuant efficacement les interruptions de produit et la perte de clients causées par un manque de puissance de calcul. Pour les fournisseurs de GPU, il permet de valoriser les ressources matérielles marginales et inutilisées à l'échelle mondiale, en établissant un canal de revenus durable pour les propriétaires de ressources GPU, afin que chaque unité de puissance de calcul puisse pleinement réaliser sa valeur dans l'ère de l'inférence.
En ce qui concerne la mise en œuvre concrète du produit, contrairement au modèle à actifs lourds des fournisseurs traditionnels de cloud centralisé, qui consiste à accumuler d'abord du matériel avant d'attendre la demande, DePIN fait naturellement face à des défis de coordination bidirectionnelle dès sa phase de construction — un excès d'offre entraîne une sous-utilisation des nœuds et l'effondrement de l'économie de jetons, tandis qu'une offre insuffisante nuit à l'expérience des développeurs et à l'efficacité du système. À cet égard, BTTInferGrid a mis en place une stratégie de lancement en phases claire, solide et orientée vers la demande, abandonnant la croissance désordonnée et non ciblée pour privilégier en priorité l'utilisation des ressources, la durabilité économique et l'expansion progressive de l'architecture technique.
· Objectif à court terme (2026) : Démarrage à froid du réseau, intégration des nœuds de base et validation des services d'inférence distribuée, avec une expansion progressive de la taille des nœuds GPU.
Objectif à moyen terme (2027) : diversifier l'écosystème, améliorer la stabilité et la sécurité des services réseau, tout en étant compatible avec davantage de formats de modèles AI et de frameworks d'inférence, tout en s'étendant progressivement à des scénarios d'application tels que le fine-tuning des modèles.
· Objectif à long terme (2028 et au-delà) : Devenir l'infrastructure de base native à l'IA, en construisant la couche de calcul privilégiée pour les agents IA et les applications automatisées, afin de fournir un soutien en calcul élastique pour les applications IA à grande échelle, permettant en fin de compte la coordination harmonieuse du calcul, du stockage distribué et des contrats intelligents sur chaîne au sein d'une architecture unifiée.
Sur le plan de la mise en œuvre, BTTInferGrid adopte également une stratégie d'évolution en phases. Au départ, le réseau repose principalement sur des cartes graphiques professionnelles ; l'accès des fournisseurs de puissance de calcul (mineurs) est soumis à une validation, tandis que les utilisateurs de la demande peuvent appeler des services d'inférence via la plateforme. À l'avenir, il évoluera vers une grille de superpuissance entièrement ouverte : prenant en charge divers types de GPU — consommateurs, professionnels et data center — avec une intégration et une tarification basées sur les performances ; les mineurs pourront s'connecter librement, tout en introduisant un mécanisme de staking pour garantir la qualité du service ; côté demande, une API unifiée sera ouverte, compatible avec plusieurs formats de modèles d'IA et frameworks d'inférence, offrant des options de déploiement flexibles.
Actuellement, BTTInferGrid a été intégré avec plusieurs grands modèles open source d'IA de premier plan, notamment Qwen3.6 27B et Qwen2.5 7B Instruct de la série Qwen d'Alibaba Cloud, ainsi que Llama 3.1 8B Instruct de Meta. Les développeurs d'IA peuvent appeler ces modèles de manière flexible et adaptée à leurs scénarios métier spécifiques. À l'avenir, la plateforme continuera d'élargir son écosystème de modèles pour offrir aux développeurs un soutien accru en matière de modèles de pointe.

Plus important encore, BTTInferGrid bénéficie d’un solide soutien issu de l’expérience à long terme de BitTorrent et BTFS, ce qui lui confère un avantage de développement naturel. BitTorrent et son sous-produit BTFS se sont spécialisés pendant des années dans le domaine du stockage décentralisé ; BitTorrent compte plus de 100 millions d’utilisateurs actifs et 2 milliards d’installations, ayant déjà validé la faisabilité du modèle DePIN et acquis des compétences matures en matière d’intégration de ressources, d’incitations par jetons, de règlement sur chaîne et d’exploitation communautaire. En tant que produit stratégique de BitTorrent dans le domaine de l’IA, BTTInferGrid est issu d’une mise à niveau des services existants de BTFS et permet de transférer sans heurts ces expériences matures au domaine du calcul d’inférence IA, accélérant ainsi la croissance de l’écosystème.
En s'appuyant sur des technologies décentralisées, BTTInferGrid a résolu avec précision le dilemme industriel consistant en la coexistence de capacités de calcul inutilisées et de pénuries de capacités de calcul. Son approche ouverte, sa collaboration décentralisée, sa reconnaissance vérifiable des contributions et son modèle de co-construction communautaire ne constituent pas seulement une rupture efficace contre le monopole centralisé des capacités de calcul, mais dessinent également, grâce à un positionnement produit clair et à une base technique solide, un nouveau panorama imaginaire pour une infrastructure mondiale décentralisée de calcul. Ici, chaque capacité de calcul inutilisée est activée, et chaque développeur peut accéder à un avenir intelligent à un coût accessible.

