NVIDIA NeMo RL añade soporte FP8 para acelerar el entrenamiento de aprendizaje por refuerzo

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
NVIDIA NeMo RL ahora admite el formato FP8 para el post-entrenamiento en aprendizaje por refuerzo, anunciado el 23 de abril (UTC+8). Esta actualización mejora la eficiencia computacional, con el modelo Qwen3-8B-Base mostrando un aumento de velocidad del 1.48x. Los operadores que siguen altcoins para observar pueden considerar esto como un posible nivel de soporte para proyectos impulsados por IA. La mejora acelera el entrenamiento de agentes para tareas complejas.

Noticias de ME, el 23 de abril (UTC+8), NVIDIA AI anunció recientemente que su biblioteca de código abierto NVIDIA NeMo RL ha incorporado una nueva funcionalidad que permite realizar el postentrenamiento de aprendizaje por refuerzo (RL) con formato de baja precisión FP8 para acelerar las cargas de trabajo computacionales relacionadas. Según la información publicada, en el modelo Qwen3-8B-Base, el uso del formato FP8 aumenta la velocidad de las cargas de trabajo de RL en 1.48 veces. Esta aceleración tiene como objetivo lograr ciclos de iteración más rápidos para el uso de herramientas por parte de agentes y tareas multipaso. (Fuente: InFoQ)

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.