清華大學與綿壁開源全球首個 AI 編碼預訓練框架 ForgeTrain KuCoinFlash
發佈時間: 26/05/2026 08:44:25
清華大學與綿壁開源了 ForgeTrain,這是全球首個由 AI 撰寫的 AI + 加密貨幣新聞預訓練框架。該框架表現優於 NVIDIA 的 Megatron,並在華為昇騰上提升 10% 的速度,同時生成了排名靠前的緊湊型模型 MiniCPM5-1B。此項目突顯了隨著 AI 工具的進步,現實世界資產(RWA)新聞整合的潛力。
ME AI 消息,據動察 Beating 監測,面壁智能與清華 NLP 實驗室在 OpenBMB 社區聯合開源全球首個完全由 AI 編寫的生產級大模型預訓練框架 ForgeTrain,並發布由 ForgeTrain 訓練的端側小模型 MiniCPM5-1B。作為首個展示「AI 製造 AI」工程閉環的樣本,ForgeTrain 在相同硬體條件下性能超越英偉達的 Megatron,在華為昇騰上預訓練時也實現了 10% 的加速。同時,MiniCPM5-1B 登頂 Artificial Analysis 開放權重小模型榜第一。為了讓 AI 自主構建底層預訓練基礎設施,面壁智能提出「代工工程」(Forge Engineering)軟體編程範式,摒棄兼容一切硬體與任務的通用框架,轉而利用 AI 低成本程式碼生成能力為特定模型和硬體現場鍛造專用程式碼。在構建機制上,ForgeTrain 採用三階段方法:首先從現有預訓練框架採集關鍵數據形成測試考場(Harness),接著在自動閉環中迭代生成二進制一致的框架程式碼,最終解除限制並實現對參考實現的超越。整個自動化演進對應 AI 製造 AI 的 L3 至 L4 階段。作為 ForgeTrain 的首個產出模型,MiniCPM5-1B 擁有 10.8 億參數,核心架構基於標準的 LlamaForCausalLM 設計,大幅降低了下游集成與推理部署門檻。在 Artificial Analysis 評測中,模型以 18 分超越 2B 規模的 Qwen3.5-2B(16 分),並領先 Qwen3.5-0.8B(11 分)與 LFM2.5-1.2B-Thinking(8 分)。模型支援 MLX 4-bit 與 GGUF Q4_K_M 等部署格式,INT4 量化後權重僅為 0.5GB,並原生支援 131,072 tokens 長文本上下文與基於 enable_thinking 的混合雙模推理。依托極低的硬體開銷,OpenBMB 同步開源了純離線運行的桌面浮窗伴侶應用 MiniCPM Desk Pet,支援實時響應 Cursor 等開發工具中的編碼活動與 LoRA 人設切換。(來源:BlockBeats)免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款 和風險披露 。