Ang mensahe ni ME AI, inilabas ng MiniMax ngayon ang malaking modelo na MiniMax M3. Ang M3 ay ang tanging open-source na malaking modelo na may tatlong modernong elemento: pagprograma, napakahabang konteksto, at native multimodal (isang plano na ilabas ang weights sa loob ng 10 araw), at nasa international leadership level sa code generation, agent, at desktop control, at maaaring subukan sa MiniMax Code, Token Plan, at API.
Para sa mahabang konteksto, ang M3 ay nagtataguyod ng unang sparse attention architecture na MSA, na gumagamit ng KV block aggregation upang makahinga ng query, na 4 beses na mas mabilis kaysa sa Flash-Sparse-Attention. Sa 1 milyong konteksto, ang bagong arkitektura ay bumababa ng computation per token sa isang ikalabing-apat na bahagi ng nakaraang henerasyon, nagtataguyod ng 9 beses na mas mabilis na pre-filling at 15 beses na mas mabilis na decoding.
Sa SWE-Bench Pro, ang M3 ay nakakuha ng 59.0%, na hihigit sa GPT-5.5 at Gemini 3.1 Pro, at malapit sa Opus 4.7, at nakakuha ng 66.0% sa Terminal Bench 2.1. Ang team ay nagbuo rin ng interactive user simulator framework para sa pagtraine ng model sa long-term collaborative planning at multi-round interaction capabilities.
Sa pagsusuri, ang M3 ay nag-run nang sarili nito ng 12 oras upang muling ipakita ang papel sa ICLR 2025 at makita ang epekto ng DPO. Sa gawain ng Hopper na optimisahin ang FP8 operator, nag-call nang 1,959 beses ang M3 sa mga kasangkapan sa loob ng 24 oras at itinataas ang paggamit ng hardware mula sa 7.6% patungo sa 71.3%, na nagdulot ng 9.4 beses na pagpapabilis. Sa pagsusuri ng PostTrainBench, ang modelo ay nakakuha ng 0.37 puntos, na kaunti lamang mas mababa kaysa sa Opus 4.7 at GPT-5.5, ngunit malinaw na nangunguna sa iba pang mga modelo.
Ang MiniMax Code ay sinync na may suporta sa desktop control ng computer. Sa subscription plan na Plus, ₱49 kada buwan ay nagbibigay ng 6 bilyong token, na halos 5 beses ang kapasidad ng Claude Pro subscription. Ang API ay nasa ilalim na, at nag-aalok ng thinking (pagsusuri) at non-thinking (mabilis) mode, at ang weights ay isasahay sa open source sa loob ng 10 araw.(来源:MiniMax)
