MiniMax 暗示 M3 AI 模型的解碼速度提升 15.6 倍

iconCryptoBriefing
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
由騰訊、阿裡巴巴和米哈遊支持的上海AI實驗室MiniMax已預覽其即將推出的M3 AI模型。該模型在1M token上下文下,解碼速度比M2快15.6倍,預填充速度快9.7倍,這些提升來自MiniMax稀疏注意力(MSA)技術,該技術採用GQA驅動的動態塊選擇。M2系列包括M2、M2.5和M2.7。目前尚未確認M3的參數數量、授權方式或發布日期。此AI + 加密貨幣新聞更新突顯了潛在的新代幣上線計劃。

由騰訊、阿里巴巴和米哈遊支持的上海人工智能實驗室 MiniMax 剛剛發布了其 M2 模型系列的技術報告。報告中隱藏了一個關於其下一代 M3 模型的暗示,該公司聲稱,在處理 1M-token 上下文時,M3 的解碼速度比 M2 快 15.6 倍,預填充速度快 9.7 倍。

MiniMax 真正打造的東西

M3 預告片背後的秘訣是 MiniMax 所稱的 MiniMax 稀疏注意力(MiniMax Sparse Attention,MSA)。它基於一種稱為 GQA 驅動的動態區塊選擇的技術。MSA 不會讓模型關注巨大上下文視窗中的每一個資訊,而是智能地選出與特定查詢真正相關的資料區塊。結果是,在輸出品質大致相同的情況下,計算量大幅減少。

MiniMax 表示,儘管速度大幅提升,M3 模型的輸出品質仍與 M2 相當。

技術報告本身涵蓋了整個 M2 系列的工程創新:M2、M2.5 和 M2.7。

廣告

值得注意的是:目前尚未提供有關 M3 的確認參數數量、授權細節或發布時間表。

MiniMax 持續擴大的佈局

MiniMax 於 2022 年初成立,於 2026 年 1 月在香港交易所上市。其投資者包括騰訊、阿里巴巴和米哈遊(《原神》的開發工作室),代表了中國科技與遊戲領域的精英。

除了文字和程式碼外,MiniMax 運營著用於影片生成的 Hailuo 平台。根據公司表示,最新版本 Hailuo 2.3 已處理了數十億個結果。

為何加密貨幣與人工智慧投資者應予以關注

去中心化推理網絡長期受延遲和成本的瓶頸限制。如果 MSA 的效率提升能轉化為每筆查詢所需的資源更少,節點運營商便能在不升級設備的情況下處理更多請求。

監控鏈上數據、執行交易或即時分析智能合約的原生加密 AI 代理,同樣受限於其底層模型處理資訊的速度。能夠以近 16 倍於以往的速度處理 1M-token 上下文的模型,開啟了以往不切實際的應用場景。

尚未確認 MiniMax 的技術與任何區塊鏈平台或數位代幣之間存在直接整合。更快的 AI 模型與加密應用之間的關聯仍屬邏輯推論,而非產品公告。

對於去中心化 AI 領域的投資者來說,關鍵指標並非 M3 的發布日期,而是 MSA 架構是否會與模型權重一同開源。如果 MiniMax 遵循其一貫的寬鬆授權模式,全球每一個去中心化推理項目都將免費升級其效率指南。若公司將 MSA 保持為專有技術,則競爭優勢將繼續集中於上海。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露