Tether 推出跨平台 BitNet LoRA 框架,可在消費級設備上訓練十億參數模型

iconPANews
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
Tether 推出了跨平台 BitNet LoRA 框架,用於鏈上新聞和加密貨幣新聞,使消費者硬體能夠訓練 Microsoft 的 1 位 BitNet 模型。該工具允許十億參數模型在筆記型電腦、智慧型手機以及 Adreno、Mali 和 Apple Bionic 等 GPU 上運行。一個 1B 參數模型約需一小時進行微調。該系統支援 Intel、AMD 和 Apple Silicon,首次將 1 位 LLM LoRA 微調帶到非 NVIDIA 裝置。BitNet 模型在行動 GPU 上的運行速度比 CPU 快 2–11 倍,記憶體使用量比 16 位版本減少 77.8%。Tether 声稱此技術可減少對雲端的依賴,實現去中心化的 AI 訓練。

PANews 3月21日消息,據官方公告,Tether 宣布推出 QVAC Fabric 中的跨平台 BitNet LoRA 微調框架,實現對 Microsoft BitNet(1-bit LLM)的訓練與推理優化。該框架顯著降低算力與內存需求,使十億參數級模型可在筆記本、消費級 GPU 及智能手機上完成訓練與微調。 該方案首次實現 BitNet 模型在移動端 GPU(包括 Adreno、Mali 及 Apple Bionic)上的微調,測試顯示,125M 參數模型可在約 10 分鐘內完成微調,1B 模型約 1 小時級別完成,甚至在手機端可擴展至 13B 參數模型。 此外,該框架支援 Intel、AMD 及 Apple Silicon 等異構硬體,並首次實現非 NVIDIA 設備上的 1-bit LLM LoRA 微調。性能方面,BitNet 模型在移動 GPU 上的推理速度較 CPU 提升 2 至 11 倍,同時在顯存佔用上較傳統 16-bit 模型最高降低約 77.8%。 Tether 表示,該技術有望打破對高端算力與雲基礎設施的依賴,推動 AI 訓練向去中心化與本地化發展,並為聯邦學習等新興應用場景提供基礎。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露