MiniMax ने बेहतर कोडिंग और मल्टीमोडल क्षमताओं के साथ M3 मॉडल लॉन्च किया

ME AI संदेश, MiniMax ने आज आधिकारिक रूप से बड़ा मॉडल MiniMax M3 लॉन्च किया। M3 वर्तमान में एकमात्र ओपन-सोर्स रास्ते का बड़ा मॉडल है जिसमें प्रोग्रामिंग, अत्यधिक लंबा संदर्भ और मूल बहुआयामी तीनों अग्रणी तत्व शामिल हैं (10 दिनों के भीतर आधिकारिक रूप से वजन ओपन-सोर्स होने की योजना है), जो कोड जनरेशन, स्मार्ट एजेंट और डेस्कटॉप कंट्रोल में अंतरराष्ट्रीय स्तर पर अग्रणी है, और इसे MiniMax Code, Token Plan और API में अनुभव किया जा सकता है।

लंबे संदर्भ के लिए, M3 ने स्पार्स अटेंशन आर्किटेक्चर MSA को शुरू किया, जो KV ब्लॉक संकलन के माध्यम से क्वेरी को हिट करता है और Flash-Sparse-Attention की तुलना में 4 गुना तेज़ मेमोरी एक्सेस करता है। 100 लाख संदर्भ पर, नया आर्किटेक्चर प्रति टोकन की गणना को पिछली पीढ़ी की बीसवीं हिस्से तक कम कर देता है, जिससे प्रीफिलिंग में 9 गुना और डिकोडिंग में 15 गुना की तेज़ी आती है।

SWE-Bench Pro पर M3 ने 59.0% का स्कोर प्राप्त किया, जो GPT-5.5 और Gemini 3.1 Pro को पार करता है और Opus 4.7 के करीब पहुँचता है, जबकि Terminal Bench 2.1 पर इसने 66.0% का स्कोर प्राप्त किया। टीम ने मॉडल की लंबी अवधि की सहयोगात्मक योजना और बहु-चरण बातचीत क्षमता को प्रशिक्षित करने के लिए एक इंटरैक्टिव यूजर सिमुलेटर फ्रेमवर्क भी विकसित किया है।

वास्तविक परीक्षण में, M3 ने 12 घंटे के अंतराल में ICLR 2025 पेपर को स्वयं चलाया और DPO प्रभाव को देखा। Hopper द्वारा FP8 ऑपरेटर के लिए अनुकूलन कार्य में, 24 घंटे में स्वयं 1959 बार उपकरणों का उपयोग किया गया, जिससे हार्डवेयर उपयोग 7.6% से बढ़कर 71.3% हो गया और 9.4 गुना तेजी आई। PostTrainBench पर स्वयं मॉडल प्रशिक्षण के वास्तविक परीक्षण में, मॉडल ने 0.37 अंक प्राप्त किए, जो Opus 4.7 और GPT-5.5 की तुलना में थोड़ा कम है, लेकिन अन्य सभी मॉडलों से स्पष्ट रूप से आगे है।

मिनिमैक्स कोड का समन्वयित अपडेट, कंप्यूटर उपयोग डेस्कटॉप कंट्रोल के लिए समर्थन करता है। प्लस स्कीम के लिए मासिक 49 युआन पर 6 अरब टोकन प्राप्त करें, जो क्लॉड प्रो सब्सक्रिप्शन की तुलना में लगभग 5 गुना क्षमता है। API अब उपलब्ध है, जो थिंकिंग रीजनिंग और नॉन-थिंकिंग फास्ट मोड प्रदान करता है, और वेट्स की योजना 10 दिनों में ओपन सोर्स होगी।（来源：MiniMax）