ME AI 消息,MiniMax 今日正式發布大模型 MiniMax M3。M3 是目前唯一齊備編程、超長上下文與原生多模態三大前沿要素的開源路線大模型(計劃 10 天內正式開源權重),在代碼生成、智能體和桌面操控上達國際領先水平,可在 MiniMax Code、Token Plan 及 API 中體驗。
針對超長上下文,M3 首創稀疏注意力架構 MSA,透過 KV 塊聚合命中查詢,記憶體存取速度比 Flash-Sparse-Attention 快 4 倍。在 100 萬上下文下,新架構將每 token 計算量降至上一代的二十分之一,實現預填充 9 倍、解碼 15 倍加速。
在 SWE-Bench Pro 上,M3 取得 59.0% 成績,超越 GPT-5.5 與 Gemini 3.1 Pro,接近 Opus 4.7,在 Terminal Bench 2.1 取得 66.0% 得分。團隊還構建了互動式用戶模擬器框架,用於訓練模型的長期協同規劃與多輪交互能力。
在實際測試中,M3 自主運行 12 小時複現 ICLR 2025 論文並觀測到 DPO 效應。在 Hopper 優化 FP8 算子任務中,24 小時內自主調用工具 1959 次,將硬體利用率從 7.6% 提升至 71.3%,加速 9.4 倍。在 PostTrainBench 自主訓練模型的實際測試中,模型獲得 0.37 分,雖略低於 Opus 4.7 與 GPT-5.5,但明顯領先其他模型。
MiniMax Code 同步更新,支援 computer use 桌面操控。訂閱方案 Plus 檔每月 49 元獲 6 億 token,約是 Claude Pro 訂閱的 5 倍容量。API 現已上線,提供 thinking 推理與 non-thinking 快速模式,權重計劃 10 天內開源。(來源:MiniMax)
