MiniMax lanza el método MSA Sparse Attention y el modelo MiniMax-M3
KuCoinFlashCompartir
Las noticias on-chain revelan que MiniMax ha presentado MSA (MiniMax Sparse Attention), un método de atención dispersa construido sobre Grouped Query Attention. El método divide la atención en una rama de índice y una rama principal, donde la rama de índice selecciona 16 bloques de tokens por grupo GQA y la rama principal realiza una atención softmax precisa sobre esos bloques. MSA se entrenó en un modelo MoE de 109 mil millones de parámetros, y MiniMax abrió el kernel de inferencia `fmha_sm100` para GPUs NVIDIA SM100 bajo la licencia MIT. La empresa también lanzó el modelo de producción MiniMax-M3, que iguala los niveles de atención completa en múltiples benchmarks. Nuevos tokens listados podrían beneficiarse de estos avances en eficiencia y rendimiento del modelo.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.