
Points clés
- Tether a introduit un cadre permettant l'entraînement de modèles linguistiques de grande taille sur des smartphones.
- Le système utilise l'architecture BitNet et un fine-tuning LoRA pour réduire les besoins en calcul.
- Les entreprises de cryptomonnaies ont augmenté leurs dépenses en infrastructure IA et en informatique haute performance.
Tether has released un nouveau cadre d'entraînement d'intelligence artificielle mardi, permettant aux grands modèles linguistiques de s'exécuter et d'être affinés sur du matériel grand public. Le système fait partie de la plateforme QVAC de l'entreprise et prend en charge les smartphones ainsi que plusieurs processeurs non Nvidia. Les ingénieurs ont conçu ce cadre pour réduire les exigences en mémoire, diminuant ainsi le seuil de coût pour construire et tester des modèles linguistiques.
Le lancement est intervenu alors que les entreprises d'infrastructure crypto s'engagent davantage dans le développement de l'intelligence artificielle et les marchés de calcul. Tether, émetteur de la plus grande stablecoin au monde en capitalisation boursière, a présenté cette sortie comme une tentative de décentraliser les capacités d'apprentissage automatique. L'entreprise a soutenu que permettre l'entraînement de modèles sur du matériel largement disponible pourrait réduire la dépendance aux fournisseurs de cloud centralisés.
Tether a introduit un système d'entraînement basé sur BitNet
L'annonce de Tether a décrit le cadre comme un environnement de formation construit sur l'architecture BitNet de Microsoft. La conception utilisait des structures de réseaux neuronaux à un bit combinées à des méthodes de fine-tuning LoRA, permettant aux développeurs d'ajuster les modèles tout en gardant les exigences informatiques faibles.
Les ingénieurs de l'entreprise ont déclaré que le système avait formé des modèles linguistiques jusqu'à un milliard de paramètres sur des smartphones en moins de deux heures. Les modèles plus petits auraient terminé l'entraînement en quelques minutes lorsqu'ils étaient optimisés selon la même approche. L'entreprise a également déclaré que la plateforme prenait en charge des modèles atteignant treize milliards de paramètres sur des appareils mobiles.
Les ingénieurs ont conçu le système pour fonctionner sur plusieurs écosystèmes matériels plutôt que de dépendre des puces Nvidia. Le cadre prenait en charge les processeurs AMD, les architectures Intel, les systèmes Apple Silicon et les processeurs graphiques mobiles de Qualcomm et Apple. Cette compatibilité a élargi l'accès à l'expérimentation en apprentissage automatique au-delà des clusters informatiques haute performance traditionnels.
La conception technique a également réduit les exigences en mémoire graphique par rapport aux modèles standards. Les résultats internes d'ingénierie ont montré que l'architecture BitNet a réduit l'utilisation de la VRAM jusqu'à 77,8 % par rapport aux systèmes 16 bits comparables.
Tether pousse le calcul IA au-delà du matériel Nvidia
Tether a déclaré que l'architecture permettait le fine-tuning LoRA sur du matériel en dehors de l'écosystème Nvidia. Les développeurs ont historiquement dépendu des processeurs graphiques Nvidia pour les charges de travail d'entraînement, car ces puces gèrent efficacement les calculs tensoriels de grande taille. Les ingénieurs de Tether ont tenté de supprimer cette limitation en permettant des méthodes d'entraînement à faible précision sur des processeurs alternatifs.
L'entreprise a affirmé que l'architecture améliorait également les vitesses d'inférence pour les charges de travail mobiles. Les tests ont indiqué que les processeurs graphiques mobiles traitaient les modèles BitNet plusieurs fois plus rapidement que les unités centrales classiques. Cette différence permettait aux modèles de s'exécuter localement sur des appareils portables, sans nécessiter d'infrastructure cloud distante.
Les développeurs ont également exploré des méthodes d'apprentissage automatique distribué au sein du système. Tether a décrit des utilisations potentielles de modèles d'apprentissage fédéré qui se mettent à jour à travers des réseaux d'appareils indépendants. Dans cette structure, les modèles apprennent à partir de données locales tout en conservant les informations sur chaque appareil plutôt que de les télécharger vers des serveurs centralisés.
L'entreprise a suggéré que cette approche pourrait soutenir des environnements d'entraînement axés sur la confidentialité. Les données restaient locales, tandis que seules les mises à jour du modèle étaient transférées à travers les réseaux. Cette architecture reflétait les tendances au sein des systèmes de calcul décentralisés et des réseaux cryptographiques distribués.
L'expansion de Tether reflète l'engouement de l'industrie des cryptomonnaies pour l'IA
L'activité du marché dans le secteur des actifs numériques a montré une augmentation des investissements dans les infrastructures d'intelligence artificielle. Les entreprises de crypto-monnaies réaffectent de plus en plus la capacité de calcul initialement conçue pour les opérations blockchain vers des charges de travail d'apprentissage automatique.
Les documents publics ont révélé que des entreprises technologiques ont établi des partenariats pour sécuriser une puissance de calcul liée à la demande en intelligence artificielle. Un accord annoncé en sept. a accordé à Google une participation minoritaire dans Cipher Mining dans le cadre d'un accord de 10 ans évalué à 3 milliards de dollars. Cet arrangement lie la capacité des centres de données aux besoins en traitement d'intelligence artificielle.
Les annonces corporatives ultérieures ont indiqué que les entreprises de minage de bitcoin ont également réorienté des capitaux vers des services d'apprentissage automatique. En décembre, le mineur IREN a détaillé des projets de lever environ 3,6 milliards de dollars pour développer l'infrastructure destinée aux opérations d'intelligence artificielle.
Les rapports de résultats des entreprises au début de l'année ont renforcé la même tendance. HIVE Digital Technologies a déclaré un chiffre d'affaires de 93,1 millions de dollars après avoir étendu ses services informatiques haute performance. Pendant la même période, Core Scientific a obtenu un accord de financement de 500 millions de dollars de la part de Morgan Stanley pour soutenir la croissance de son infrastructure informatique.
Les développeurs ont également expérimenté avec des agents d'intelligence artificielle autonomes intégrés à l'infrastructure blockchain. Coinbase a lancé des outils de wallet permettant aux agents logiciels d'exécuter des transactions directement sur la chaîne. Alchemy a introduit des services permettant aux agents d'accéder aux données blockchain tout en réglant les paiements via l'infrastructure stablecoin.
Les réseaux d'identité ont également exploré le lien entre les systèmes d'intelligence artificielle et la vérification numérique. World, le réseau d'identité cofondé par Sam Altman, PDG d'OpenAI, a lancé AgentKit plus tôt cette semaine. Ce kit de développement permet aux agents logiciels de vérifier leur lien avec une identité humaine unique via le système World ID.
Le dernier cadre de Tether a pénétré le même secteur en expansion où les ressources informatiques, l'apprentissage automatique et les systèmes blockchain se croisent.
L'entreprise a déclaré que les développeurs pourraient intégrer les outils de formation dans des applications distribuées et des appareils locaux sans dépendre de serveurs centralisés.
Le prochain développement du cadre d'intelligence artificielle de Tether dépendra de l'adoption par les développeurs et des tests de performance au niveau des appareils. Les ingénieurs surveilleront probablement la manière dont la plateforme QVAC gère les grands modèles sur du matériel consommateur distribué lors des prochaines versions.
L'article Tether dévoile un cadre IA permettant l'entraînement de modèles sur smartphones est apparu en premier sur The Coin Republic.
