MiniMax 暗示 M3 AI 模型的解碼速度提升 15.6 倍

由騰訊、阿里巴巴和米哈遊支持的上海人工智能實驗室 MiniMax 剛剛發布了其 M2 模型系列的技術報告。報告中隱藏了一個關於其下一代 M3 模型的暗示，該公司聲稱，在處理 1M-token 上下文時，M3 的解碼速度比 M2 快 15.6 倍，預填充速度快 9.7 倍。

MiniMax 真正打造的東西

M3 預告片背後的秘訣是 MiniMax 所稱的 MiniMax 稀疏注意力（MiniMax Sparse Attention，MSA）。它基於一種稱為 GQA 驅動的動態區塊選擇的技術。MSA 不會讓模型關注巨大上下文視窗中的每一個資訊，而是智能地選出與特定查詢真正相關的資料區塊。結果是，在輸出品質大致相同的情況下，計算量大幅減少。

MiniMax 表示，儘管速度大幅提升，M3 模型的輸出品質仍與 M2 相當。

技術報告本身涵蓋了整個 M2 系列的工程創新：M2、M2.5 和 M2.7。

值得注意的是：目前尚未提供有關 M3 的確認參數數量、授權細節或發布時間表。

MiniMax 持續擴大的佈局

MiniMax 於 2022 年初成立，於 2026 年 1 月在香港交易所上市。其投資者包括騰訊、阿里巴巴和米哈遊（《原神》的開發工作室），代表了中國科技與遊戲領域的精英。

除了文字和程式碼外，MiniMax 運營著用於影片生成的 Hailuo 平台。根據公司表示，最新版本 Hailuo 2.3 已處理了數十億個結果。

為何加密貨幣與人工智慧投資者應予以關注

去中心化推理網絡長期受延遲和成本的瓶頸限制。如果 MSA 的效率提升能轉化為每筆查詢所需的資源更少，節點運營商便能在不升級設備的情況下處理更多請求。

監控鏈上數據、執行交易或即時分析智能合約的原生加密 AI 代理，同樣受限於其底層模型處理資訊的速度。能夠以近 16 倍於以往的速度處理 1M-token 上下文的模型，開啟了以往不切實際的應用場景。

尚未確認 MiniMax 的技術與任何區塊鏈平台或數位代幣之間存在直接整合。更快的 AI 模型與加密應用之間的關聯仍屬邏輯推論，而非產品公告。

對於去中心化 AI 領域的投資者來說，關鍵指標並非 M3 的發布日期，而是 MSA 架構是否會與模型權重一同開源。如果 MiniMax 遵循其一貫的寬鬆授權模式，全球每一個去中心化推理項目都將免費升級其效率指南。若公司將 MSA 保持為專有技術，則競爭優勢將繼續集中於上海。