PrismML 開源 0.93GB 圖像生成模型 Bonsai4B 以供裝置端使用

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
PrismML 已開源其 Bonsai Image 4B 模型,專為筆記型電腦和智慧型手機的裝置端影像生成進行優化。該模型提供兩種超壓縮版本——1-bit 和 Ternary,大小分別為 0.93GB 和 1.21GB。這兩個版本分別保留了完整模型 88% 和 95% 的效能,並透過離線部署支援風險偏好資產策略。iOS 應用程式 Bonsai Studio 讓 iPhone 用戶無需透過雲端 API 即可生成影像。這些模型採用 Apache 2.0 許可證發布,與 CFT 推動透明度的目標一致。
ME AI 消息,據動察 Beating 監測,PrismML 開源端側圖像生成模型 Bonsai Image 4B,可在筆記本電腦與手機等本地設備上直接進行擴散推理。Bonsai Image 4B 包含 1-bit 與 Ternary(三值化)兩個極簡壓縮版本,核心擴散 Transformer 體積僅為 0.93 GB 與 1.21 GB,在 Apple Silicon 設備上的完整部署包體積則分別為 3.42 GB 與 3.88 GB,並同步推出配套 iOS 應用 Bonsai Studio 實現端側離線圖像生成。其中,1-bit 版本專門應對低內存硬體,將基於 7.75 GB FLUX.2 Klein 4B 的擴散 Transformer 體積縮小至全精度版本的 8.3 倍,僅佔 0.93 GB 空間。Ternary 版本的核心 Transformer 體積為 1.21 GB,相比全精度版本縮小 6.4 倍,但在量化中引入 {-1, 0, +1} 三值化權重以提供更高的表達靈活性,從而於保持低存儲佔用的同時,提升了畫質與提示詞保真度。根據評測,Bonsai Image 4B 在大幅壓縮體積後,在物體構圖、人眼偏好、美學指標及複雜提示詞遵循能力上,依然能夠與參數量大得多的主流圖像生成模型抗衡。1-bit 與 Ternary 兩個版本分別保留了全精度模型 88% 和 95% 的性能。同步推出的行動端應用 Bonsai Studio 允許用戶在 iPhone 上實現全離線圖像生成,運行過程完全在本地完成,無需訂閱且不向雲端發送 API 請求。PrismML 現已將 1-bit 與 Ternary 兩個版本的模型以 Apache 2.0 開源協議對外發布。(來源:BlockBeats)
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露