Ipinakilala ni MiniMax ang M3 model na may mas mataas na kakayahan sa pag-code at multimodal

iconKuCoinFlash
I-share
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconSummary

expand icon
Ang MiniMax M3, isang bagong modelo na may pinakamataas na kasanayan sa pag-code at multimodal, ay nasa live na. Itinatalo nito ang GPT-5.5 at Gemini 3.1 Pro sa paggawa ng code at sumasapat sa mga pandaigdigang pamantayan sa pagganap ng agent. Gumagamit ang modelo ng MSA, isang bagong sparse attention design, upang pabilisin at mapabuti ang efficiency. Ito ay magiging open-source sa loob ng 10 araw. Ang update na ito ay nagdadala ng bagong balita sa crypto para sa mga developer at mga entusiyasta sa AI.

Ang mensahe ni ME AI, inilabas ng MiniMax ngayon ang malaking modelo na MiniMax M3. Ang M3 ay ang tanging open-source na malaking modelo na may tatlong modernong elemento: pagprograma, napakahabang konteksto, at native multimodal (isang plano na ilabas ang weights sa loob ng 10 araw), at nasa international leadership level sa code generation, agent, at desktop control, at maaaring subukan sa MiniMax Code, Token Plan, at API.

Para sa mahabang konteksto, ang M3 ay nagtataguyod ng unang sparse attention architecture na MSA, na gumagamit ng KV block aggregation upang makahinga ng query, na 4 beses na mas mabilis kaysa sa Flash-Sparse-Attention. Sa 1 milyong konteksto, ang bagong arkitektura ay bumababa ng computation per token sa isang ikalabing-apat na bahagi ng nakaraang henerasyon, nagtataguyod ng 9 beses na mas mabilis na pre-filling at 15 beses na mas mabilis na decoding.

Sa SWE-Bench Pro, ang M3 ay nakakuha ng 59.0%, na hihigit sa GPT-5.5 at Gemini 3.1 Pro, at malapit sa Opus 4.7, at nakakuha ng 66.0% sa Terminal Bench 2.1. Ang team ay nagbuo rin ng interactive user simulator framework para sa pagtraine ng model sa long-term collaborative planning at multi-round interaction capabilities.

Sa pagsusuri, ang M3 ay nag-run nang sarili nito ng 12 oras upang muling ipakita ang papel sa ICLR 2025 at makita ang epekto ng DPO. Sa gawain ng Hopper na optimisahin ang FP8 operator, nag-call nang 1,959 beses ang M3 sa mga kasangkapan sa loob ng 24 oras at itinataas ang paggamit ng hardware mula sa 7.6% patungo sa 71.3%, na nagdulot ng 9.4 beses na pagpapabilis. Sa pagsusuri ng PostTrainBench, ang modelo ay nakakuha ng 0.37 puntos, na kaunti lamang mas mababa kaysa sa Opus 4.7 at GPT-5.5, ngunit malinaw na nangunguna sa iba pang mga modelo.

Ang MiniMax Code ay sinync na may suporta sa desktop control ng computer. Sa subscription plan na Plus, ₱49 kada buwan ay nagbibigay ng 6 bilyong token, na halos 5 beses ang kapasidad ng Claude Pro subscription. Ang API ay nasa ilalim na, at nag-aalok ng thinking (pagsusuri) at non-thinking (mabilis) mode, at ang weights ay isasahay sa open source sa loob ng 10 araw.(来源:MiniMax)

Disclaimer: Ang information sa page na ito ay maaaring nakuha mula sa mga third party at hindi necessary na nagre-reflect sa mga pananaw o opinyon ng KuCoin. Ibinigay ang content na ito para sa mga pangkalahatang informational purpose lang, nang walang anumang representation o warranty ng anumang uri, at hindi rin ito dapat ipakahulugan bilang financial o investment advice. Hindi mananagot ang KuCoin para sa anumang error o omission, o para sa anumang outcome na magreresulta mula sa paggamit ng information na ito. Maaaring maging risky ang mga investment sa mga digital asset. Pakisuri nang maigi ang mga risk ng isang produkto at ang risk tolerance mo batay sa iyong sariling kalagayang pinansyal. Para sa higit pang information, mag-refer sa aming Terms ng Paggamit at Disclosure ng Risk.