Tether lanza el marco Cross-Platform BitNet LoRA para entrenar modelos de IA de miles de millones de parámetros en dispositivos de consumo

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Tether anunció un marco BitNet LoRA multiplataforma para noticias en cadena y noticias de IA + cripto, permitiendo que modelos de IA de mil millones de parámetros se entrenen en dispositivos de consumo. El marco, parte de QVAC Fabric, optimiza BitNet de Microsoft para un bajo consumo computacional y de memoria. Admite Adreno, Mali, Apple Bionic y más, con modelos de 1B afinados en aproximadamente una hora. El hardware no NVIDIA ahora admite el entrenamiento de LLM de 1 bit. Los modelos BitNet funcionan de 2 a 11 veces más rápido en GPU móviles que en CPU, utilizando un 77,8% menos de VRAM que los modelos de 16 bits. Tether afirma que esta tecnología reduce la dependencia de la nube y respalda el entrenamiento descentralizado de IA.

Odaily Planet Daily informa que, según un anuncio oficial, Tether ha lanzado el marco de ajuste fino BitNet LoRA en QVAC Fabric, optimizando el entrenamiento y la inferencia para Microsoft BitNet (LLM de 1 bit). Este marco reduce significativamente la demanda de potencia de cálculo y memoria, permitiendo que modelos de mil millones de parámetros se entrenen y ajusten finamente en laptops, GPU de consumo y smartphones.

Este方案首次实现BitNet模型在移动端GPU(包括Adreno、Mali y Apple Bionic)上的微调,测试显示,125M参数模型可在约10分钟内完成微调,1B模型约1小时级别完成,甚至在手机端可扩展至13B参数模型。

Además, este marco admite hardware heterogéneo como Intel, AMD y Apple Silicon, y logra por primera vez el ajuste LoRA de LLM de 1-bit en dispositivos no NVIDIA. En términos de rendimiento, la inferencia de los modelos BitNet en GPU móviles es de 2 a 11 veces más rápida que en CPU, y reduce el uso de memoria de video hasta un 77.8% en comparación con los modelos tradicionales de 16-bit.

Tether indica que esta tecnología tiene el potencial de romper la dependencia de la potencia de cómputo de gama alta y la infraestructura en la nube, impulsando el entrenamiento de IA hacia la descentralización y la localización, y proporcionando una base para nuevas aplicaciones como el aprendizaje federado.

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.