Noticias de ME, 19 de mayo (UTC+8): según el monitoreo de Beating, ByteDance Research ha lanzado oficialmente como código abierto el modelo multimodal unificado nativo Lance. Este es un modelo ligero con solo 3B parámetros activos, que admite simultáneamente la comprensión, generación y edición de imágenes y videos dentro de un solo marco. Los modelos unificados dominantes actualmente dependen en gran medida de aumentar el tamaño de los parámetros o utilizar arquitecturas de texto a imagen; Lance, en cambio, ha logrado una ruta colaborativa con un consumo extremadamente bajo de recursos computacionales. El equipo de desarrollo entrenó el modelo completamente desde cero y redujo el presupuesto total de cálculo durante todo el ciclo de entrenamiento a solo 128 GPU A100. Para resolver los conflictos internos entre diferentes modalidades y tareas, Lance implementa dos aislamientos estrictos en su arquitectura: - Utiliza una arquitectura de mezcla de expertos (MoE) de doble flujo para procesar secuencias multimodales entrelazadas, desacoplando las rutas de cálculo para comprensión y generación mientras comparten un contexto subyacente común. - Introduce codificación de posición rotacional sensible a la modalidad, reduciendo directamente la interferencia de señal entre los tokens visuales heterogéneos de imágenes y videos. La compresión extrema de recursos computacionales no ha reducido el límite de rendimiento. Con solo 3B parámetros activos, el rendimiento de Lance en la generación y edición de imágenes y videos lidera la mayoría de las pruebas de referencia frente a otros modelos unificados abiertos existentes, logrando una ruta de bajo costo que combina generación y comprensión semántica con parámetros reducidos mediante cooperación multitarea. (Fuente: BlockBeats)
ByteDance abre el código del modelo multimodal de 3 mil millones de parámetros Lance, entrenado en 128 GPU A100
KuCoinFlashCompartir






ByteDance lanzó como código abierto su modelo multimodal de 3 mil millones de parámetros, Lance, el 19 de mayo, entrenado con 128 GPU A100. El modelo maneja tareas de imagen y video en un solo marco. Los datos en cadena muestran un aumento en el interés abierto en proyectos criptográficos impulsados por IA. Lance utiliza un diseño MoE de doble flujo y codificación de rotación consciente de la modalidad para reducir costos manteniendo un rendimiento sólido. El interés abierto en tokens relacionados con IA ha crecido de forma constante este trimestre.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.