Elon Musk 的 xAI 完成 Grok V9-Medium 訓練,專注於複雜程式設計

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
xAI、埃隆·馬斯克的團隊根據最新鏈上消息,已完成參數量為 1.5T 的 Grok V9-Medium 模型訓練。該模型現已進入監督微調階段,並即將開始強化學習。團隊在訓練過程中加入了大量 Cursor 代碼,並計劃進一步增加。與目前處理所有生產流量的 v8-small 模型相比,Grok V9-Medium 預期在複雜程式設計方面表現更佳。馬斯克此前曾承認 v8-small 模型的訓練數據存在嚴重缺陷。新版本將參數數量增至三倍,並針對 Blackwell 架構的 GPU 進行優化,未來可能有助於提升通脹數據處理效率。
ME AI 消息,據動察 Beating 監測,馬斯克宣布 xAI 旗下 1.5T 參數的 Grok V9-Medium 基礎模型已完成訓練,預計在 2 至 3 週內面向公眾發布。目前模型已進入監督微調階段,並將在幾天內開啟強化學習訓練。研發團隊在補充訓練中吸納了大量 Cursor 的代碼數據,並且後續還將繼續灌入更多樣本。相較於目前支撐 Grok 全部生產流量的 v8-small 模型,擁有 1.5T 參數的 Grok V9-Medium 將在處理複雜編程任務時實現大幅升級。先前馬斯克曾公開承認,僅有 0.5T 參數的 v8-small(即外測版本 Grok 4.2)在訓練數據質量、全面性以及比例上存在嚴重缺陷。完成訓練的 Grok V9-Medium 不僅在參數規模上擴充至前代的三倍,還專門針對 Blackwell 架構 GPU 進行了針對性優化。(來源:BlockBeats)
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露