MiniMax 推出 M3 模型,具備更強的編碼和多模態能力

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
MiniMax M3 是一款具備頂級編碼和多模態能力的新模型,現已上線。它在程式碼生成方面超越 GPT-5.5 和 Gemini 3.1 Pro,並在代理效能上達到全球標準。該模型採用新型稀疏注意力設計 MSA,以提升速度與效率,並將於 10 天後開源。此更新為開發者和 AI 愛好者帶來全新的加密貨幣新聞。

ME AI 消息,MiniMax 今日正式發布大模型 MiniMax M3。M3 是目前唯一齊備編程、超長上下文與原生多模態三大前沿要素的開源路線大模型(計劃 10 天內正式開源權重),在代碼生成、智能體和桌面操控上達國際領先水平,可在 MiniMax Code、Token Plan 及 API 中體驗。

針對超長上下文,M3 首創稀疏注意力架構 MSA,透過 KV 塊聚合命中查詢,記憶體存取速度比 Flash-Sparse-Attention 快 4 倍。在 100 萬上下文下,新架構將每 token 計算量降至上一代的二十分之一,實現預填充 9 倍、解碼 15 倍加速。

在 SWE-Bench Pro 上,M3 取得 59.0% 成績,超越 GPT-5.5 與 Gemini 3.1 Pro,接近 Opus 4.7,在 Terminal Bench 2.1 取得 66.0% 得分。團隊還構建了互動式用戶模擬器框架,用於訓練模型的長期協同規劃與多輪交互能力。

在實際測試中,M3 自主運行 12 小時複現 ICLR 2025 論文並觀測到 DPO 效應。在 Hopper 優化 FP8 算子任務中,24 小時內自主調用工具 1959 次,將硬體利用率從 7.6% 提升至 71.3%,加速 9.4 倍。在 PostTrainBench 自主訓練模型的實際測試中,模型獲得 0.37 分,雖略低於 Opus 4.7 與 GPT-5.5,但明顯領先其他模型。

MiniMax Code 同步更新,支援 computer use 桌面操控。訂閱方案 Plus 檔每月 49 元獲 6 億 token,約是 Claude Pro 訂閱的 5 倍容量。API 現已上線,提供 thinking 推理與 non-thinking 快速模式,權重計劃 10 天內開源。(來源:MiniMax)

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露