Tether lance QVAC, une plateforme locale d'IA pour défier les modèles basés sur le cloud

CoinDesk rapporte :

QVAC peut-il développer un modèle suffisamment puissant pour inciter les utilisateurs à accepter un seuil d'exploitation modéré en échange d'un contrôle local et autonome ?

Article rédigé par Liam Akiba Wright

Traduction : Luffy, Foresight News

Le nouveau projet de Tether, QVAC, commence avec une idée rare dans les entreprises de stablecoins. L'entreprise décrit QVAC Psy comme une série de grands modèles fondés sur les principes de la psychohistoire.

Le concept de psychohistoire provient de la série de science-fiction classique d'Isaac Asimov, « Foundation ». Dans les romans, le personnage principal Hari Seldon utilise les mathématiques, la statistique et la dynamique sociale pour prédire les tendances du comportement des grandes masses, afin de réduire l'ère sombre qui suit l'effondrement de l'Empire galactique.

L'Encyclopédie de la science-fiction définit la psychohistoire, telle que décrite par Asimov, comme une science fictive ; l'ensemble du plan d'Hari Seldon vise à prédire les événements futurs et à préserver la connaissance et la civilisation humaines au moment de l'effondrement du système social.

Tether exprime ainsi sa mission d'entreprise en utilisant un langage de science-fiction.

Grâce à ses actifs de réserve, sa liquidité et ses capacités de distribution, Tether a créé le plus grand système de stablecoin de l'industrie cryptographique ; aujourd'hui, il reproduit cette logique sous-jacente dans le domaine de l'intelligence artificielle.

L'actif stable USDT constitue le premier pilier des réserves de Tether ; tandis que la puissance de calcul, les modèles d'IA, les jeux de données et les capacités intelligentes capables de fonctionner indépendamment du cloud centralisé deviennent le deuxième actif de réserve de Tether.

Passer des réserves en dollars aux réserves en actifs intelligents

Tether entre dans l'intelligence artificielle, en poursuivant la logique de fonctionnement de ses activités principales. L'USDT transforme la demande mondiale de dollars hors frontière en un portefeuille d'actifs réservés principalement composé d'obligations souveraines à court terme.

Selon le rapport d'audit des réserves du premier trimestre 2026 de Tether, le bénéfice net de l'entreprise s'élève à 1,04 milliard de dollars américains, les fonds de couverture des réserves s'élèvent à 8,23 milliards de dollars américains, les passifs liés aux jetons s'élèvent à environ 183 milliards de dollars américains, et les obligations du Trésor américain à court terme détenues directement et indirectement s'élèvent à environ 141 milliards de dollars américains.

Une base de réserves solide permet à Tether de générer des revenus constants, de disposer d'une capacité bilan suffisante et de tirer parti de ses bénéfices opérationnels pour investir dans des infrastructures à long terme.

CryptoSlate avait précédemment analysé que Tether, grâce à son important volume de stablecoin, pouvait effectuer une allocation stratégique de ses réserves. En janvier de cette année, Tether a investi 8 888 BTC, confirmant sa capacité à convertir les revenus d'intérêts et les bénéfices opérationnels en une demande d'allocation à long terme en bitcoins. Le projet QVAC étend cette logique d'allocation d'actifs à un tout nouveau secteur : l'intelligence artificielle.

Outre ses investissements dans le bitcoin, l’or, les startups, l’industrie énergétique, le minage de cryptomonnaies et les infrastructures de communication, Tether s’engage désormais fortement dans l’intelligence artificielle elle-même. Ce positionnement permet à Tether de passer d’un émetteur simple de liquidités en dollars privés à un constructeur d’infrastructures numériques privées.

La narration de science-fiction de la « psychohistoire » correspond parfaitement à cette orientation stratégique ; Tether considère l'intelligence artificielle comme une infrastructure fondamentale au niveau civilisationnel, et non comme un simple secteur logiciel. Les documents officiels de QVAC se positionnent comme une « plateforme intelligente infiniment stable », mettant en avant un système intelligent décentralisé fonctionnant en priorité localement, dans le but de rivaliser avec et de remplacer les IA centralisées.

La vision de QVAC indique que confier tous les interactions intelligentes à des serveurs centralisés est non seulement lent et peu stable, mais comporte également un risque de contrôle et de restriction ; QVAC s'engage à devenir la base périphérique dédiée au système intelligent de l'utilisateur.

Ces principes résonnent avec la philosophie des stablecoins de Tether. Les transferts de fonds n'exigent pas d'autorisation, les utilisateurs conservent le contrôle de leurs données, et l'intelligence artificielle s'exécute localement à proximité.

Mais sous le concept de science-fiction d'Asimov se cache le jugement plus sérieux de Tether : la valeur de l'intelligence artificielle ne s'ancrera véritablement que lorsqu'elle possédera une résilience et une résistance au risque d'infrastructure.

Les grands modèles en nuage offrent des capacités plus globales, mais comportent des risques liés à la plateforme, à la tarification, à la réglementation, à la latence réseau et au routage des données ; les modèles AI locaux, bien qu'ils sacrifient une partie des performances, offrent en contrepartie la propriété, la confidentialité et une stabilité disponible en continu.

Cette logique de compromis s'aligne étroitement sur les principes de l'industrie cryptographique. Bien que l'auto-hébergement soit moins pratique que le hébergement par une bourse, ce n'est qu'au moment où les risques de faillite des bourses éclatent que l'on comprend réellement sa valeur ; de même, bien que l'IA locale soit moins facile à utiliser qu'un modèle hébergé dans le cloud, dès qu'une interruption réseau, un changement d'API, un blocage de compte ou une impossibilité d'exporter des données survient, les avantages du déploiement local deviennent évidents.

QVAC : Une architecture AI périphérique sur un créneau différent

La différenciation clé de QVAC réside dans son architecture sous-jacente. Les principaux modèles de grande taille, tels qu'OpenAI, Anthropic, Google DeepMind et xAI, se disputent la suprématie en matière de capacités générales, de compétences en programmation, d'interaction multimodale, de raisonnement sur de longs contextes, d'applications d'agents et de déploiement cloud entreprise.

QVAC a quant à lui choisi un tout autre parcours : la déployabilité, la protection de la vie privée, la faible latence, la composable et l'indépendance vis-à-vis d'une seule plateforme.

La documentation d'introduction officielle de QVAC définit le projet comme un écosystème open source et multiplateforme, axé sur l'exécution locale privilégiée et les applications AI point à point, compatible avec Linux, macOS, Windows, Android et iOS. Les utilisateurs peuvent exécuter localement des tâches AI telles que des modèles de langage à grande échelle, la reconnaissance vocale et la génération améliorée par recherche (RAG), ou déléguer les tâches d'inférence à d'autres nœuds via la fonction P2P intégrée.

Cela signifie que les critères de référence de QVAC sont radicalement différents de ceux des principaux modèles d'IA cloud : les avancées en IA cherchent à offrir les capacités les plus puissantes de modèles généralistes via des services centralisés ; QVAC se concentre sur l'endroit où se produit l'inférence, le contrôle de l'exécution, la conservation des données localement sur l'appareil, et la capacité de l'application à continuer de fonctionner en cas de défaillance du service centralisé.

Tether lancera le SDK QVAC en avril 2026, offrant un ensemble de développement unifié permettant aux développeurs de créer, exécuter et affiner des applications AI sur n'importe quel appareil, avec une compatibilité totale sur toutes les plateformes sans modification du code.

Le SDK QVAC est compatible avec divers moteurs d'inférence locaux via une couche d'abstraction unifiée, notamment QVAC Fabric développé en interne, une version forkée de llama.cpp, ainsi que des outils vocaux et de traduction tels que whisper.cpp, Parakeet et Bergamot.

Il a longtemps dépassé le cadre de la publication de modèles uniques pour devenir une sorte de système d'exploitation sous-jacent à l'intelligence artificielle. L'écosystème open source de l'IA compte désormais de nombreux composants matures : Llama, Qwen, Mistral, Gemma, DeepSeek, Hugging Face, llama.cpp, Ollama, et bien d'autres projets d'inférence locale prospèrent.

Le pari central de QVAC est que les développeurs ont un besoin urgent d’un cadre complet en périphérie, intégrant via une interface unifiée le chargement de modèles, l’inférence, la reconnaissance vocale, la reconnaissance OCR de texte et d’images, la traduction, la génération d’images à partir de texte, la génération augmentée par recherche, la distribution P2P de modèles, l’inférence déléguée et le fine-tuning local.

QVAC vise à devenir l'infrastructure de distribution du calcul intelligent, en s'appuyant sur des modèles locaux de milieu de gamme en constante itération pour saisir l'entrée de l'écosystème AI en périphérie.

QVAC Fabric est le cœur de l'architecture technique complète. Tether indique que Fabric permet d'ajuster les modèles sur du matériel grand public courant grâce aux backend Vulkan et Metal, en s'adaptant aux appareils Android équipés de cartes graphiques Qualcomm Adreno ou ARM Mali, aux appareils dotés de puces Apple conçues en interne, ainsi qu'aux ordinateurs Windows et Linux équipés de matériel AMD, Intel ou NVIDIA.

En parallèle, utilisez la technique de division dynamique pour répondre aux limitations de mémoire sur les appareils mobiles, et prenez en charge le processus de micro-adaptation LoRA accéléré par GPU ainsi que l'ajustement par instruction avec perte de masque.

Si ce flux de travail est validé par des développeurs externes, sa valeur dépassera largement celle d'une simple publication de modèle open source : les poids du modèle ne constituent que la couche de base ; le fine-tuning local et l'adaptation personnalisée constituent l'ajout de valeur essentiel.

MedPsy : QVAC fait face à sa première épreuve de force réelle

MedPsy est le premier modèle phare déployé par QVAC. Selon un rapport technique publié sur Hugging Face le 7 mai, QVAC MedPsy est un modèle linguistique dédié à la santé médicale, conçu pour le déploiement en périphérie, disponible en deux versions : 1,7 milliard et 4 milliards de paramètres.

L'officiel avance une affirmation profondément révolutionnaire : après un entraînement rigoureux spécialisé dans le domaine médical, de petits modèles peuvent surpasser les grands modèles de référence médicaux, tout en étant compatibles avec les ordinateurs portables, les appareils mobiles haut de gamme et même les smartphones.

QVAC indique que MedPsy-1,7 milliard de paramètres obtient une moyenne de 62,62 points sur sept benchmarks médicaux fermés, dépassant largement les 51,20 points de MedGemma-1.5-4B-it, alors que son nombre de paramètres est inférieur à la moitié ; MedPsy-4 milliards de paramètres obtient une moyenne de 70,54 points, légèrement supérieure aux 69,95 points de MedGemma-27B-text-it, avec seulement un septième du nombre de paramètres.

L'écart s'élargit encore plus lors des tests HealthBench et HealthBench Hard : MedPsy-4B obtient respectivement 74,00 et 58,00 points, tandis que MedGemma-27B-text-it n'atteint que 65,00 et 42,67 points.

Si ces résultats peuvent être reproduits par un tiers, cela confirmera directement l'idée centrale de QVAC : dans des domaines verticaux à haute valeur ajoutée, des modèles légers en périphérie peuvent défier des systèmes cloud massifs.

Le processus d'entraînement illustre également la stratégie concurrentielle de QVAC : MedPsy utilise Qwen 3 comme modèle de base, en optimisant itérativement par un affinage supervisé en plusieurs étapes et un apprentissage par renforcement sur des questions médicales ; pendant les expériences, plus de 30 millions de données synthétiques ont été générées, utilisant une formation en deux phases avec le modèle de grande taille Baichuan M3-235B comme modèle enseignant supervisé pour l'inférence sur de longs textes.

Son jeu de données d'entraînement n'est pas encore public, ce qui constitue un point critique : les performances impressionnantes actuelles sur les benchmarks proviennent toutes d'évaluations internes de QVAC. Des questions essentielles concernant la contamination des données d'entraînement, leur couverture, la conception des invites et l'influence du modèle enseignant nécessitent une validation externe.

Les avantages au niveau du déploiement quantifié sont marqués ; l'officiel a publié des versions quantifiées GGUF compatibles avec llama.cpp et QVAC SDK. La quantification Q4_K_M permet de réduire la taille du modèle de 69 % tout en maintenant une perte moyenne inférieure à 1 point. Dans la solution optimale équilibrant taille et performance, le modèle de 4 milliards de paramètres ne pèse que 2,72 Go, et la version de 1,7 milliard de paramètres seulement 1,28 Go, facilitant ainsi son déploiement sur des appareils locaux.

QVAC fournit également un avertissement de risque : MedPsy ne prend en charge que les interactions textuelles, est limité à l'anglais, n'est pas adapté aux scénarios d'urgence clinique, présente les hallucinations inhérentes aux grands modèles, et nécessite que les développeurs garantissent la confidentialité et la sécurité des utilisateurs dans l'ensemble de l'architecture de l'application.

Le domaine médical présente un besoin fort pour l'inférence locale ; les perspectives de MedPsy sont prometteuses ; mais seule la reproduction des résultats de référence par des chercheurs externes, ainsi que des tests réels dans des processus cliniques, pourra véritablement démontrer sa capacité.

Convenience vs. Control: The Ultimate Battle in the AI Industry

Le débat entre l'IA locale et l'IA cloud est souvent réduit à un choix entre confidentialité et performance. QVAC restructure cette logique, relevant fondamentalement d'un compromis entre commodité et maîtrise autonome.

L'IA cloud excelle par une extrême facilité d'utilisation : les utilisateurs ouvrent l'application, saisissent une commande et obtiennent un résultat, sans avoir à se soucier des poids du modèle, de la mémoire vidéo du dispositif, des paramètres de quantification, des embeddings vectoriels ou de la compatibilité de l'environnement d'exécution — la plateforme assume toute la complexité technique. Cette simplicité extrême est la raison fondamentale de la montée rapide des plateformes centralisées d'IA, permettant aux utilisateurs d'accéder à des capacités intelligentes de pointe avec un seuil d'entrée très faible.

QVAC exige que les développeurs et les utilisateurs assument davantage de responsabilités opérationnelles, en échange d'une nouvelle architecture de sécurité : fonctionnement local hors ligne, disponibilité sans connexion Internet, réduction des fuites de données et indépendance vis-à-vis des API, tout en établissant des canaux de traitement peer-to-peer et de distribution de modèles.

Selon la présentation du Tether SDK, les applications équipées de QVAC peuvent fonctionner de manière stable même dans des conditions de réseau faible, et même en l'absence totale de connexion, l'intelligence artificielle continue de fonctionner normalement. Dans une annonce précoce de QVAC en 2025, il est prévu davantage : les agents IA peuvent être déployés directement sur les appareils locaux, interagissant de manière collaborative via un réseau P2P ; associés à la suite WDK, ils peuvent effectuer automatiquement des transactions d'actifs tels que le Bitcoin et l'USDT.

C'est exactement la logique supérieure complète de Tether : fonds, puissance de calcul, agents, tous suivant le même paradigme de conception d'autonomie souveraine.

Bien sûr, son récit décentralisé n'est pas parfait. En permettant aux utilisateurs de télécharger les modèles eux-mêmes, de les exécuter localement et de conserver les données sensibles sur leurs appareils, QVAC réalise une forte décentralisation au niveau de l'inférence, éliminant ainsi le contrôle de la plateforme sur chaque instruction d'interaction, contrairement aux API hébergées. Grâce à l'architecture réseau Holepunch, QVAC prend en charge des capacités de base P2P telles que l'inférence déléguée et la distribution décentralisée des modèles, offrant une conception architecturale véritablement innovante.

Cependant, des attributs centralisés persistent au niveau de la gouvernance. QVAC est entièrement financé, nommé et promu par Tether ; son application phare, son système de modèles, sa feuille de route SDK et la notion de « stabilité intelligente » sont tous dirigés par une seule entreprise.

Cette situation ne contredit pas sa valeur fondamentale d'approche locale, mais limite les avantages de la décentralisation à la couche d'exécution des raisonnements les mieux étayés par des preuves ; l'écosystème doit progressivement établir un mécanisme de gestion distribuée en ce qui concerne les nœuds d'enregistrement par défaut, les canaux de publication des versions, les normes de sécurité, l'admission des modèles et la gouvernance communautaire à long terme.

La reproduction du test détermine la hauteur finale de QVAC

Aujourd'hui, la crédibilité de QVAC dépend entièrement des résultats de reproductibilité par un tiers. Si les scores de référence de MedPsy peuvent être reproduits dans un environnement d'évaluation externe, Tether réalisera véritablement l'idée de « réserves d'actifs intelligents » : un modèle vertical, léger, open source et déployable localement, suffisamment performant pour rivaliser avec les grands modèles cloud dans des domaines à haute sensibilité.

Même si les tests tiers réduisent ou inversent l'écart de performance, la valeur infrastructurelle de QVAC reste valide, bien que le récit autour des performances du modèle s'affaiblisse. La question ultime de l'industrie revient toujours aux lois éternelles de la technologie : la commodité extrême engendre une concentration du pouvoir, tandis que le contrôle autonome exige des coûts d'exploitation.

C’est précisément la valeur de la vision de science-fiction d’Asimov : la psychohistoire dans « Fondation », qui étudie les lois d’évolution des systèmes complexes sous pression ; tandis que Tether lui confère une nouvelle signification, en se concentrant sur la manière dont les infrastructures résistent au monopole centralisé.

La narration scientifique est ambitieuse, la mise en œuvre technologique se trouve encore à un stade précoce, mais la logique stratégique globale est claire et cohérente. Tether s'appuie sur les flux de trésorerie continus de la plus grande stablecoin au monde pour construire une architecture IA centrée sur l'exécution locale, un réseau peer-to-peer, des outils open source et des modèles légers en périphérie, étendant ainsi le concept d'autonomie souveraine des stablecoins du domaine monétaire au domaine intelligent.

Aujourd'hui, l'industrie ne remet plus en question la capacité des géants des stablecoins à s'implanter dans l'IA. La réponse est évidente.

La question fondamentale est de savoir si QVAC peut développer un modèle et une infrastructure suffisamment robustes pour inciter les utilisateurs à accepter un seuil d'exploitation modéré en échange d'une autonomie locale.

MedPsy constitue précisément le premier seuil quantifiable. Les résultats de réplication par un tiers détermineront si la narration psychohistorique de QVAC n'est qu'une métaphore de science-fiction, ou si elle entre officiellement dans la course des IA de pointe, dotée d'une architecture fondamentale avec une logique opérationnelle complète.