MiniMax 推出 M3 模型，具備更強的編碼和多模態能力

ME AI 消息，MiniMax 今日正式發布大模型 MiniMax M3。M3 是目前唯一齊備編程、超長上下文與原生多模態三大前沿要素的開源路線大模型（計劃 10 天內正式開源權重），在代碼生成、智能體和桌面操控上達國際領先水平，可在 MiniMax Code、Token Plan 及 API 中體驗。

針對超長上下文，M3 首創稀疏注意力架構 MSA，透過 KV 塊聚合命中查詢，記憶體存取速度比 Flash-Sparse-Attention 快 4 倍。在 100 萬上下文下，新架構將每 token 計算量降至上一代的二十分之一，實現預填充 9 倍、解碼 15 倍加速。

在 SWE-Bench Pro 上，M3 取得 59.0% 成績，超越 GPT-5.5 與 Gemini 3.1 Pro，接近 Opus 4.7，在 Terminal Bench 2.1 取得 66.0% 得分。團隊還構建了互動式用戶模擬器框架，用於訓練模型的長期協同規劃與多輪交互能力。

在實際測試中，M3 自主運行 12 小時複現 ICLR 2025 論文並觀測到 DPO 效應。在 Hopper 優化 FP8 算子任務中，24 小時內自主調用工具 1959 次，將硬體利用率從 7.6% 提升至 71.3%，加速 9.4 倍。在 PostTrainBench 自主訓練模型的實際測試中，模型獲得 0.37 分，雖略低於 Opus 4.7 與 GPT-5.5，但明顯領先其他模型。

MiniMax Code 同步更新，支援 computer use 桌面操控。訂閱方案 Plus 檔每月 49 元獲 6 億 token，約是 Claude Pro 訂閱的 5 倍容量。API 現已上線，提供 thinking 推理與 non-thinking 快速模式，權重計劃 10 天內開源。（來源：MiniMax）