中國 AI 里程碑:1.6T 參數 DeepSeek 模型已於國內 Ascend 910C 完成全訓練
KuCoinFlash由深圳合縱學院、哈工大(深圳)、深圳大數據研究院與華為組成的聯合團隊,已在國產昇騰910C AI平台完成1.6萬億參數DeepSeek-V4-Pro模型的完整後訓練。此鏈上新聞標誌著第三方團隊首次使用超過1,000顆昇騰910C晶片實現1.6T參數模型的完整訓練。該團隊將模型計算利用率提升超過30%,關鍵運算元效率提升14%,且在超過1,500個訓練步驟中未發生任何系統故障。AI + 加密貨幣新聞凸顯了國內AI能力與基礎設施的持續成長。
ME AI 消息,根據動察 Beating 監測,由深圳河套學院、哈工大(深圳)、深圳市大數據研究院與華為相關團隊組成,並協同深智城 AI 算力平台的聯合攻關團隊,宣布在國產 AI 算力平台上成功跑通 1.6 萬億參數大模型 DeepSeek-V4-Pro 的全參數後訓練(Post-training)。這是全球第三方機構首次在國產算力平台上完成 1.6 萬億參數規模模型的全參數後訓練。相較於從零開始的預訓練(Pre-training),後訓練階段(主要包括監督微調 SFT 與強化學習 RL)側重於通過高質量指令和人類偏好對齊,教導模型遵循指令並執行特定任務。然而,對於 1.6 萬億參數的 MoE 架構模型而言,全參數後訓練依然對底層硬體的顯存容量、多卡間通信頻寬(如 MoE 路由所觸發的全對全通信)以及大規模集群的穩定性有著非常苛刻的要求。聯合攻關團隊依托超千張晶片規模的華為昇騰 910C 算力集群,通過優化分佈式承載與負載均衡策略,成功克服了通信瓶頸。在長達 1500 多步的訓練過程中,系統未出現一次中斷,模型算力利用率(MFU)超過 30%,關鍵算子效率提升了 14%,各項指標均達到工業級運行標準。業內分析指出,華為昇騰 910C 集群在萬億級模型訓練上的成功跑通,印證了國產 AI 芯片在承載超大規模模型深度訓練任務時的技術可行性。由於此前大模型研發的核心預訓練多依賴英偉達 GPU 集群,國產算力此前主要承擔推理(Inference)或小參數微調任務。本次聯合攻關的成功,標誌著國產算力生態正加速從「僅支持推理」向「承載超大參數模型全參數訓練」的技術閉環過渡。(來源:MLion)免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款和風險披露 。