DeepSeek 在 DeepSeek-R1 發佈一年後推出新模型「MODEL1」

iconKuCoinFlash
分享
AI summary icon精華摘要

BlockBeats 訊息,1 月 21 日,據量子位報導,DeepSeek-R1 發佈一週年之際,曝光了新模型「MODEL1」。DeepSeek 在 GitHub 更新 FlashMLA 程式碼,橫跨 114 個檔案中有 28 處提及 MODEL1,與 V32 作為不同模型出現。已知 V32 是 DeepSeek-V3.2,MODEL1 很可能是新架構。程式碼中的具體差異體現在 KV 緩存佈局、稀疏性處理和 FP8 解碼方面,記憶體優化上有數處不同。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露