Mensaje de ME AI: MiniMax lanza oficialmente hoy el modelo grande MiniMax M3. M3 es el único modelo de gran escala de código abierto que integra las tres características avanzadas: programación, contexto extremadamente largo y multimodalidad nativa (los pesos se abrirán oficialmente en 10 días), alcanzando un nivel internacional líder en generación de código, agentes inteligentes y control de escritorio, y puede experimentarse en MiniMax Code, Token Plan y API.
Para contextos extremadamente largos, M3 introduce por primera vez la arquitectura de atención dispersa MSA, que logra un rendimiento 4 veces más rápido que Flash-Sparse-Attention mediante la agregación de bloques KV para coincidir con las consultas. Con un contexto de 1 millón, la nueva arquitectura reduce el cálculo por token a la vigésima parte de la generación anterior, logrando una aceleración de 9 veces en el prellenado y 15 veces en la decodificación.
En SWE-Bench Pro, M3 obtuvo un 59.0%, superando a GPT-5.5 y Gemini 3.1 Pro, y acercándose a Opus 4.7, con una puntuación del 66.0% en Terminal Bench 2.1. El equipo también desarrolló un marco de simulador de usuario interactivo para entrenar la capacidad de planificación colaborativa a largo plazo y la interacción multirround del modelo.
En pruebas reales, M3 ejecutó automáticamente durante 12 horas para reproducir el artículo de ICLR 2025 y observó el efecto DPO. En la tarea de optimización de operadores FP8 en Hopper, llamó automáticamente a herramientas 1959 veces en 24 horas, aumentando la utilización del hardware del 7.6% al 71.3%, logrando una aceleración de 9.4 veces. En pruebas reales de entrenamiento autónomo en PostTrainBench, el modelo obtuvo una puntuación de 0.37, ligeramente por debajo de Opus 4.7 y GPT-5.5, pero claramente por encima del resto de modelos.
Actualización sincronizada de MiniMax Code, que admite el control del escritorio de computer use. Con el plan de suscripción Plus, por 49 yuanes al mes obtienes 600 millones de tokens, aproximadamente cinco veces la capacidad de la suscripción de Claude Pro. La API ya está disponible, ofrece modos de razonamiento thinking y rápido non-thinking, y los pesos se abrirán en 10 días.(来源:MiniMax)
