
Principales conclusiones
- Tether presentó un marco que permite el entrenamiento de modelos de lenguaje grandes en smartphones.
- El sistema utilizó la arquitectura BitNet y el ajuste fino LoRA para reducir las necesidades de cómputo.
- Las empresas de criptomonedas aumentaron el gasto en infraestructura de IA y cómputo de alto rendimiento.
Tether lanzó un nuevo marco de entrenamiento de inteligencia artificial el martes que permite que los modelos de lenguaje grande se ejecuten y ajusten en hardware de consumo. El sistema forma parte de la plataforma QVAC de la empresa y admite smartphones junto con varios procesadores no Nvidia. Los ingenieros diseñaron el marco para reducir los requisitos de memoria, disminuyendo así la barrera de costo para construir y probar modelos de lenguaje.
El lanzamiento ocurrió mientras las empresas de infraestructura cripto profundizaban su desarrollo en inteligencia artificial y mercados de cómputo. Tether, emisora de la stablecoin más grande por capitalización de mercado, presentó el lanzamiento como un intento por descentralizar las capacidades de aprendizaje automático. La empresa argumentó que permitir el entrenamiento de modelos en hardware ampliamente disponible podría reducir la dependencia de proveedores de nube centralizados.
Tether presentó un sistema de entrenamiento basado en BitNet
El anuncio de Tether describió el marco como un entorno de entrenamiento construido sobre la arquitectura BitNet de Microsoft. El diseño utilizó estructuras de redes neuronales de un bit combinadas con métodos de ajuste fino LoRA, permitiendo a los desarrolladores ajustar modelos mientras mantienen bajas las demandas de cómputo.
Los ingenieros de la empresa dijeron que el sistema entrenó modelos de lenguaje con hasta mil millones de parámetros en smartphones en menos de dos horas. Se informó que los modelos más pequeños completaron el entrenamiento en minutos cuando se optimizaron mediante el mismo enfoque. La empresa también afirmó que la plataforma admitía modelos de hasta trece mil millones de parámetros en dispositivos móviles.
Los ingenieros diseñaron el sistema para operar en varios ecosistemas de hardware en lugar de depender de chips de Nvidia. El marco compatible con procesadores AMD, arquitecturas Intel, sistemas Apple Silicon y procesadores gráficos móviles de Qualcomm y Apple. Esa compatibilidad amplió el acceso a la experimentación de aprendizaje automático más allá de los clústeres tradicionales de cómputo de alto rendimiento.
El diseño técnico también redujo los requisitos de memoria gráfica en comparación con los modelos estándar. Los resultados internos de ingeniería mostraron que la arquitectura BitNet redujo el uso de VRAM hasta en un 77,8% en comparación con sistemas de 16 bits comparables.
Tether impulsa la computación de IA más allá del hardware de Nvidia
Tether dijo que la arquitectura permitió el ajuste fino de LoRA en hardware fuera del ecosistema de Nvidia. Los desarrolladores históricamente dependían de los procesadores gráficos de Nvidia para cargas de trabajo de entrenamiento porque esos chips manejaban cálculos de tensores grandes de manera eficiente. Los ingenieros de Tether intentaron eliminar esa limitación permitiendo métodos de entrenamiento de bajo bit en procesadores alternativos.
La empresa argumentó que la arquitectura también mejoró las velocidades de inferencia para cargas de trabajo móviles. Las pruebas indicaron que los procesadores gráficos móviles procesaron modelos BitNet varias veces más rápido que las unidades centrales de procesamiento estándar. Esa diferencia permitió que los modelos se ejecutaran localmente en dispositivos portátiles en lugar de requerir infraestructura remota en la nube.
Los desarrolladores también exploraron métodos de aprendizaje automático distribuido dentro del sistema. Tether describió posibles usos para modelos de aprendizaje federado que se actualizan a través de redes de dispositivos independientes. Bajo esa estructura, los modelos aprenden a partir de datos locales manteniendo la información en cada dispositivo en lugar de subirla a servidores centralizados.
La empresa sugirió que el enfoque podría respaldar entornos de entrenamiento centrados en la privacidad. Los datos permanecieron locales, mientras que solo las actualizaciones del modelo se transfirieron a través de redes. Esa arquitectura reflejó las tendencias dentro de los sistemas de cómputo descentralizados y las redes criptográficas distribuidas.
La expansión de Tether refleja el impulso de IA de la industria cripto
La actividad del mercado en el sector de activos digitales mostró un aumento en la inversión en infraestructura de inteligencia artificial. Las empresas de cripto reutilizaron cada vez más la capacidad de cómputo originalmente construida para operaciones de cadena de bloques hacia cargas de trabajo de aprendizaje automático.
Los archivos públicos revelaron que las empresas tecnológicas establecieron asociaciones para asegurar capacidad de cómputo vinculada a la demanda de inteligencia artificial. Un acuerdo anunciado en septiembre otorgó a Google una participación minoritaria en Cipher Mining como parte de un acuerdo de 10 años valorado en $3 mil millones. El acuerdo vinculó la capacidad de los centros de datos con las necesidades de procesamiento de inteligencia artificial.
Los anuncios corporativos posteriores indicaron que las empresas de minería de bitcoin también redirigieron capital hacia servicios de aprendizaje automático. En dic., el minero IREN detalló planes para recaudar aproximadamente 3.6 mil millones de dólares para expandir la infraestructura de operaciones de inteligencia artificial.
Los informes de resultados corporativos a principios del año reforzaron la misma tendencia. HIVE Digital Technologies reportó ingresos de $93.1 millones tras expandir sus servicios de cómputo de alto rendimiento. Aproximadamente en el mismo período, Core Scientific obtuvo una línea de crédito de $500 millones de Morgan Stanley para apoyar el crecimiento de su infraestructura de cómputo.
Los desarrolladores también experimentaron con agentes de inteligencia artificial autónomos integrados con infraestructura de cadena de bloques. Coinbase lanzó herramientas de monedero que permiten a los agentes de software ejecutar transacciones directamente en la cadena. Alchemy introdujo servicios que permiten a los agentes acceder a datos de la cadena de bloques mientras liquidan pagos mediante infraestructura de stablecoin.
Las redes de identidad también exploraron la conexión entre sistemas de inteligencia artificial y verificación digital. World, la red de identidad cofundada por Sam Altman, director de OpenAI, lanzó AgentKit a principios de esta semana. El kit de herramientas permitió a los agentes de software verificar su conexión a una identidad humana única a través del sistema World ID.
El último marco de Tether ingresó al mismo sector en expansión donde se cruzan los recursos de cómputo, el aprendizaje automático y los sistemas de cadena de bloques.
La empresa dijo que los desarrolladores podrían integrar las herramientas de entrenamiento en aplicaciones distribuidas y dispositivos locales sin depender de servidores centralizados.
El próximo desarrollo del marco de inteligencia artificial de Tether’s dependerá de la adopción por parte de desarrolladores y pruebas de rendimiento a nivel de dispositivo. Los ingenieros probablemente monitorearán cómo la plataforma QVAC maneja modelos grandes en hardware consumidor distribuido durante los próximos lanzamientos.
La publicación Tether presenta un marco de IA que permite el entrenamiento de modelos en smartphones apareció por primera vez en The Coin Republic.
