由騰訊、阿里巴巴和米哈遊支持的上海人工智能實驗室 MiniMax 剛剛發布了其 M2 模型系列的技術報告。報告中隱藏了一個關於其下一代 M3 模型的暗示,該公司聲稱,在處理 1M-token 上下文時,M3 的解碼速度比 M2 快 15.6 倍,預填充速度快 9.7 倍。
MiniMax 真正打造的東西
M3 預告片背後的秘訣是 MiniMax 所稱的 MiniMax 稀疏注意力(MiniMax Sparse Attention,MSA)。它基於一種稱為 GQA 驅動的動態區塊選擇的技術。MSA 不會讓模型關注巨大上下文視窗中的每一個資訊,而是智能地選出與特定查詢真正相關的資料區塊。結果是,在輸出品質大致相同的情況下,計算量大幅減少。
MiniMax 表示,儘管速度大幅提升,M3 模型的輸出品質仍與 M2 相當。
技術報告本身涵蓋了整個 M2 系列的工程創新:M2、M2.5 和 M2.7。
值得注意的是:目前尚未提供有關 M3 的確認參數數量、授權細節或發布時間表。
MiniMax 持續擴大的佈局
MiniMax 於 2022 年初成立,於 2026 年 1 月在香港交易所上市。其投資者包括騰訊、阿里巴巴和米哈遊(《原神》的開發工作室),代表了中國科技與遊戲領域的精英。
除了文字和程式碼外,MiniMax 運營著用於影片生成的 Hailuo 平台。根據公司表示,最新版本 Hailuo 2.3 已處理了數十億個結果。
為何加密貨幣與人工智慧投資者應予以關注
去中心化推理網絡長期受延遲和成本的瓶頸限制。如果 MSA 的效率提升能轉化為每筆查詢所需的資源更少,節點運營商便能在不升級設備的情況下處理更多請求。
監控鏈上數據、執行交易或即時分析智能合約的原生加密 AI 代理,同樣受限於其底層模型處理資訊的速度。能夠以近 16 倍於以往的速度處理 1M-token 上下文的模型,開啟了以往不切實際的應用場景。
尚未確認 MiniMax 的技術與任何區塊鏈平台或數位代幣之間存在直接整合。更快的 AI 模型與加密應用之間的關聯仍屬邏輯推論,而非產品公告。
對於去中心化 AI 領域的投資者來說,關鍵指標並非 M3 的發布日期,而是 MSA 架構是否會與模型權重一同開源。如果 MiniMax 遵循其一貫的寬鬆授權模式,全球每一個去中心化推理項目都將免費升級其效率指南。若公司將 MSA 保持為專有技術,則競爭優勢將繼續集中於上海。
