Message AI ME, MiniMax lance officiellement aujourd'hui le modèle de grande taille MiniMax M3. M3 est le seul modèle open source à intégrer les trois éléments avancés : programmation, contexte ultra-long et multimodalité native (les poids seront ouverts dans les 10 jours à venir). Il atteint un niveau international de pointe en matière de génération de code, d'agents intelligents et de commande de bureau, et est disponible sur MiniMax Code, Token Plan et API.
Pour les contextes extrêmement longs, M3 introduit une architecture d'attention clairsemée MSA, qui accélère de 4 fois la comparaison de mémoire par rapport à Flash-Sparse-Attention en regroupant les blocs KV pour répondre aux requêtes. Avec un contexte de 1 million, la nouvelle architecture réduit la charge de calcul par token à un vingtième de celle de la génération précédente, permettant une accélération de 9 fois pour le pré-remplissage et de 15 fois pour le décodage.
Sur SWE-Bench Pro, M3 obtient un score de 59,0 %, dépassant GPT-5.5 et Gemini 3.1 Pro, et se rapprochant de Opus 4.7, avec un score de 66,0 % sur Terminal Bench 2.1. L'équipe a également développé un cadre de simulateur utilisateur interactif pour entraîner les capacités de planification collaborative à long terme et d'interaction multiround du modèle.
Lors de tests pratiques, M3 s'est exécuté de manière autonome pendant 12 heures pour reproduire un article de l'ICLR 2025 et a observé l'effet DPO. Dans la tâche d'optimisation des opérateurs FP8 sur Hopper, M3 a appelé automatiquement des outils 1959 fois en 24 heures, augmentant l'utilisation du matériel de 7,6 % à 71,3 %, soit une accélération de 9,4 fois. Lors des tests de formation autonome sur PostTrainBench, le modèle a obtenu un score de 0,37, légèrement inférieur à Opus 4.7 et GPT-5.5, mais nettement supérieur aux autres modèles.
Mise à jour synchronisée de MiniMax Code, avec prise en charge du contrôle de bureau pour computer use. Le forfait Plus à 49 yuans par mois offre 6 milliards de tokens, soit environ cinq fois la capacité du forfait Claude Pro. L'API est désormais disponible, proposant un mode de raisonnement « thinking » et un mode rapide « non-thinking » ; les poids seront open source dans les 10 prochains jours.(来源:MiniMax)
