Google DeepMind 推出 DiffusionGemma,文字生成速度提升 4 倍
KuCoinFlash分享






鏈上新聞:Google DeepMind 已推出 DiffusionGemma,這是一款開源的文字生成模型,速度提升 4 倍。該模型採用擴散技術,可並行生成 256 個 token,在 H100 上實現超過 1000 tokens/s,在 RTX 5090 上實現 700+ tokens/s。26B MoE 模型在推理時僅激活 3.8B 參數,經量化後支援消費級 GPU。其具備雙向注意力與自我修正功能,非常適合程式碼補全與內聯編輯。該模型已根據 Apache 2.0 許可證開源。新 token 上市或可從此類生成效率的提升中受益。
來源:顯示原文
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款和風險披露 。