MiniMax ay nagpapakita ng M3 AI model na may 15.6x mas mabilis na decoding speed

Ang MiniMax, ang AI lab na nakabase sa Shanghai na suportado ng Tencent, Alibaba, at miHoYo, ay naglabas ng isang teknikal na ulat tungkol sa kanilang M2 model series. Nakalulubos sa loob nito ang isang preview ng kanilang susunod na henerasyon na M3 model, na ayon sa kumpanya ay nakakamit ng 15.6x mas mabilis na decoding speed at 9.7x mas mabilis na prefill speed kumpara sa M2 habang pinoproseso ang 1M-token contexts.

Ano ang tunay na binuo ni MiniMax

Ang lihim na sangkap sa teaser ng M3 ay isang teknolohiya na tinatawag ni MiniMax na MiniMax Sparse Attention, o MSA. Ito ay batay sa isang teknik na tinatawag na GQA-driven dynamic block selection. Sa halip na magbigay-pansin ang modelo sa bawat hiwalay na impormasyon sa isang malaking context window, pinipili nang matalino ng MSA kung aling mga bloke ng data ang tunay na mahalaga para sa isang partikular na query. Ang resulta ay mas malaking pagbawas sa compute para sa halos parehong kalidad ng output.

Sinasabi ni MiniMax na panatilihin ng M3 model ang kalidad ng output na katumbas ng M2 sa kabila ng mga malaking pagpapabilis.

Kumakatawan ang teknikal na ulat sa mga inobasyon sa inhenyeriya sa buong M2 lineup: M2, M2.5, at M2.7.

Paghahayag

Mahalagang tandaan: wala pang ibinigay na pinatotohanang bilang ng parameter, detalye ng lisensya, o timeline ng paglabas para sa M3.

Patuloy na paglalawak ng MiniMax

Itinatag sa maagang bahagi ng 2022, listahan ng MiniMax sa Hong Kong Stock Exchange noong Enero 2026. Ang mga tagasuporta nito, Tencent, Alibaba, at miHoYo (ang studio sa likod ng Genshin Impact), ay kumakatawan sa isang kros-seksyon ng mga eksperto sa teknolohiya at paglalaro ng China.

Sa labas ng teksto at code, nagpapatakbo ang MiniMax ng platform na Hailuo para sa paggawa ng video. Ang Hailuo 2.3, ang pinakabagong bersyon, ay nakaproseso ng bilyun-bilyong resulta ayon sa kompanya.

Bakit dapat pansinin ng mga investor sa crypto at AI

Ang mga decentralized inference networks ay patuloy na nakakaranas ng bottleneck dahil sa latency at gastos. Kung ang mga pagpapabuti sa efficiency ng MSA ay magdudulot ng mas maliit na resource footprint bawat query, maaaring masuportahan ng mga node operator ang higit pang mga kahilingan nang hindi nag-uupgrade ng kanilang mga rig.

Ang mga AI agent na crypto-native na nagmomonito ng on-chain data, nagpapatupad ng mga trade, o nag-aanalis ng mga smart contract sa real time ay may magkakatulad na pagkakasayang batay sa bilis kung gaano kabilis ang kanilang mga pundamental na modelo na makapagproseso ng impormasyon. Ang isang modelo na nakakahandle ng 1M-token contexts sa halos 16x ang dating bilis ay buksan ang mga gamit na dati ay hindi praktikal.

Hindi pa pinatotohanan ang anumang direkta integrasyon sa pagitan ng teknolohiya ni MiniMax at anumang blockchain platform o digital token. Ang ugnayan sa pagitan ng mas mabilis na AI models at mga crypto application ay isang lohikal na inferences, hindi isang pahayag ng produkto.

Para sa mga investor sa larangan ng decentralized AI, ang pangunahing sukat na dapat subaybayan ay hindi ang petsa ng paglabas ni M3. Ito ay kung susuriin ba ng MSA architecture ang mga timbang ng modelo kasama nito. Kung susundin ni MiniMax ang kanilang itinatag na pattern ng permissive licensing, ang bawat decentralized inference project sa buong mundo ay makakakuha ng libreng upgrade sa kanilang playbook para sa efficiency. Kung panatilihin ng kumpanya ang MSA bilang proprietary, ang kompetitibong advantage ay mananatiling sentralisado sa Shanghai.