MiniMax Melancarkan Model M3 dengan Kemampuan Pengekodan dan Multimodal yang Lebih Unggul

Mesej AI ME, MiniMax secara rasmi melancarkan model besar MiniMax M3 hari ini. M3 ialah model besar laluan sumber terbuka pertama yang menggabungkan tiga elemen terkini: pemrograman, konteks sangat panjang, dan multimodal asli (rencana untuk membuka sumber beratnya dalam 10 hari), dengan prestasi terkemuka antarabangsa dalam penghasilan kod, agen pintar, dan pengendalian desktop, boleh dialami melalui MiniMax Code, Token Plan, dan API.

Untuk konteks yang sangat panjang, M3 memperkenalkan arsitektur perhatian jarang pertama, MSA, yang menggunakan agregasi blok KV untuk menemukan kueri, 4 kali lebih cepat dalam rasio akses memori dibanding Flash-Sparse-Attention. Dalam konteks 1 juta, arsitektur baru mengurangi jumlah komputasi per token menjadi satu per dua puluh dari generasi sebelumnya, mencapai percepatan 9 kali untuk pre-filling dan 15 kali untuk decoding.

Di SWE-Bench Pro, M3 mencapai skor 59.0%, melampaui GPT-5.5 dan Gemini 3.1 Pro, serta mendekati Opus 4.7, dengan skor 66.0% di Terminal Bench 2.1. Pasukan juga membina kerangka simulasi pengguna interaktif untuk melatih kemampuan perancangan kolaboratif jangka panjang dan interaksi berbilang putaran model.

Dalam ujian sebenar, M3 beroperasi secara autonomi selama 12 jam untuk mereplikasi kertas ICLR 2025 dan mengamati kesan DPO. Dalam tugas mengoptimumkan operator FP8 pada Hopper, ia memanggil alat secara autonomi sebanyak 1959 kali dalam 24 jam, meningkatkan penggunaan peranti dari 7.6% kepada 71.3%, mempercepatkan sebanyak 9.4 kali. Dalam ujian pelatihan autonomi PostTrainBench, model ini mendapat skor 0.37, sedikit lebih rendah daripada Opus 4.7 dan GPT-5.5, tetapi jelas lebih unggul daripada model lain.

MiniMax Code disegerakkan secara serentak, menyokong pengendalian desktop computer use. Rancangan langganan Plus mendapat 6 miliar token sebulan dengan harga RM49, kira-kira 5 kali kapasiti langganan Claude Pro. API kini tersedia, menawarkan mod pemikiran dan mod pantas tanpa pemikiran, dengan rancangan pembukaan sumber dalam 10 hari.（来源：MiniMax）