Nucleus-Image 開源,擁有 17B 參數,每次推論激活 2B

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
於 4 月 16 日(UTC+8),Nucleus AI 在 Apache 2.0 授權下開源了 Nucleus-Image 模型。該模型基於 MetaEra 構建,採用具有 17B 參數的稀疏 MoE diffusion transformer,但在推理時僅激活 2B 參數以降低成本。在未經後訓練的情況下,該模型在三個基準測試中表現優於或與頂級閉源模型相當。此舉與全球加密貨幣市場對風險偏好資產和 CFT 動作的廣泛興趣相符。

ME News 消息,4 月 16 日(UTC+8),據動察 Beating 監測,Nucleus AI 團隊發布文生圖模型 Nucleus-Image,同步開源模型權重、訓練代碼和訓練數據集,許可證為 Apache 2.0,可商用。模型採用稀疏混合專家(MoE)擴散變換器架構,總參數量 17B,分佈在每層 64 個路由專家中,每次推理僅激活約 2B 參數,推理成本顯著低於同參數量級的密集模型。在三項標準基準上,Nucleus-Image 與閉源頭部模型持平甚至超越:GenEval 得分 0.87,與千問圖像模型持平,空間位置子項(0.85)居所有對比模型之首;DPG-Bench 得分 88.79,綜合排名第一;OneIG-Bench 得分 0.522,超過谷歌 Imagen4(0.515)和 Recraft V3(0.502)。以上成績全部來自純預訓練,未做 DPO、強化學習或人類偏好調優。Nucleus AI 官方稱這是「該質量級別上首個全開源 MoE 擴散模型」。訓練數據從網絡大規模爬取,經多輪過濾、去重和美學評分後保留 7 億張圖片,生成 15 億图文對;訓練分三階段從 256 到 1024 分辨率逐步推進,共 170 萬步。文本編碼器使用 Qwen3-VL-8B-Instruct,通過 diffusers 庫調用,並內置跨去噪步驟的文本 KV 緩存,進一步降低推理開銷。對需要在本地部署圖像生成的開發者來說,17B 參數但只需激活 2B 的設計意味著消費級 GPU 也有運行空間。完整開源(權重 + 訓練代碼 + 數據集)相對罕見——多數開源圖像模型只放權重,數據集和訓練細節仍封閉,這也是文生圖領域可複現研究的主要瓶頸之一。(來源:BlockBeats)

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露