MiniMax antepone el modelo M3 con una velocidad de decodificación 15.6 veces más rápida

MiniMax, el laboratorio de IA con sede en Shanghái respaldado por Tencent, Alibaba y miHoYo, acaba de publicar un informe técnico sobre su serie de modelos M2. Dentro de él se encuentra una pista de su próximo modelo M3, que la empresa afirma logra una velocidad de decodificación 15,6 veces más rápida y una velocidad de prellenado 9,7 veces más rápida en comparación con M2 al procesar contextos de 1 millón de tokens.

Lo que realmente construyó MiniMax

La fórmula secreta detrás del avance de M3 es algo que MiniMax llama Atención Esparsa de MiniMax, o MSA. Está construida sobre una técnica llamada selección dinámica de bloques impulsada por GQA. En lugar de hacer que el modelo preste atención a cada pieza de información en una ventana de contexto masiva, MSA selecciona inteligentemente qué bloques de datos realmente importan para una consulta dada. El resultado es un cálculo drásticamente menor con una calidad de salida aproximadamente igual.

MiniMax afirma que el modelo M3 mantiene una calidad de salida comparable a la de M2 a pesar de estas mejoras significativas en velocidad.

El informe técnico cubre las innovaciones de ingeniería en toda la línea M2: M2, M2.5 y M2.7.

Anuncio

Vale la pena señalar: aún no se ha proporcionado ningún parámetro confirmado, detalles de licencia o cronograma de lanzamiento para M3.

La creciente presencia de MiniMax

Fundada a principios de 2022, MiniMax se listó en la Bolsa de Valores de Hong Kong en enero de 2026. Sus patrocinadores, Tencent, Alibaba y miHoYo (el estudio detrás de Genshin Impact), representan un cruce de la élite tecnológica y de juegos de China.

Más allá del texto y el código, MiniMax opera la plataforma Hailuo para la generación de videos. Hailuo 2.3, la última iteración, ha procesado miles de millones de resultados según la empresa.

Por qué los inversores en cripto y IA deben prestar atención

Las redes de inferencia descentralizadas siempre están limitadas por la latencia y el costo. Si las mejoras de eficiencia de MSA se traducen en huellas de recursos más pequeñas por consulta, los operadores de nodos podrían atender más solicitudes sin actualizar sus equipos.

Los agentes de IA nativos de cripto que monitorean datos en cadena, ejecutan operaciones o analizan contratos inteligentes en tiempo real están igualmente limitados por la velocidad con la que sus modelos subyacentes pueden procesar información. Un modelo que maneja contextos de 1 millón de tokens a casi 16 veces la velocidad anterior abre casos de uso que anteriormente eran impracticables.

No se han confirmado integraciones directas entre la tecnología de MiniMax y ninguna plataforma de cadena de bloques o token digital. La conexión entre modelos de IA más rápidos y aplicaciones cripto sigue siendo una inferencia lógica, no un anuncio de producto.

Para los inversores en el espacio de IA descentralizada, la métrica clave a vigilar no es la fecha de lanzamiento de M3. Es si la arquitectura MSA se abrirá junto con los pesos del modelo. Si MiniMax sigue su patrón establecido de licencias permisivas, cada proyecto de inferencia descentralizada del planeta obtendrá una actualización gratuita a su guía de eficiencia. Si la empresa mantiene MSA como propiedad, la ventaja competitiva permanecerá centralizada en Shanghái.