字節跳動開源了在 128 塊 A100 GPU 上訓練的 30 億參數多模態模型 Lance

iconKuCoinFlash
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
ByteDance 於 5 月 19 日開源了其 3B 參數的多模態模型 Lance,該模型使用 128 塊 A100 GPU 訓練而成,可在單一框架中處理圖像和視頻任務。鏈上數據顯示,以 AI 為驅動的加密貨幣項目未平倉量持續上升。Lance 採用雙流 MoE 架構與模態感知旋轉編碼,可在降低成本的同時保持強大性能。本季度,與 AI 相關的代幣未平倉量穩步增長。

ME News 消息,5 月 19 日(UTC+8),據動察 Beating 監測,字節跳動(ByteDance Research)正式開源原生統一多模態大模型 Lance。這是一個激活參數僅為 3B 的輕量級模型,在單一框架內同時支援圖像與視頻的理解、生成及編輯。目前主流統一模型高度依賴擴大參數規模或沿用文生圖架構,Lance 則跑通了極低算力的協同路線。研發團隊讓模型完全從零開始訓練,並將整個訓練週期的總計算預算壓低至 128 張 A100 GPU。為解決不同模態與任務間的內部衝突,Lance 在架構上做了兩項硬性隔離:- 採用雙流混合專家(MoE)架構處理交織的多模態序列,在共享底層上下文的同時,解耦理解與生成的計算路徑。- 引入模態感知的旋轉位置編碼,直接削弱圖像和視頻異構視覺 token 之間的訊號干擾。極端的算力壓縮並未拉低性能上限。在僅有 3B 激活參數的情況下,Lance 的圖像與視頻生成及編輯表現在絕大多數基準測試中領跑現有開源統一模型,通過多任務協同跑通了小參數兼顧生成與語義理解的低成本路線。(來源:BlockBeats)

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露