Hugging Face 推出適用於預編譯 GPU 操作的 Kernels Hub

KuCoinFlash

發佈時間： 15/04/2026 04:12:44

精華摘要

Hugging Face 執行長 Clem Delangue 確認 Kernels 於 4 月 15 日（UTC+8）正式上線 Hub，這對開發者而言是一項重要的鏈上新聞事件。Kernels 提供預編譯的 GPU 操作符，可將推論和訓練速度提升 1.7 至 2.5 倍。開發者現在只需一行程式碼即可安裝這些操作符，雲端編譯由 Hugging Face 處理。Hub 會自動匹配硬體，並在數秒內交付檔案。作為頂級倉庫類型，Kernels 包含 61 個常用任務的操作符，支援 NVIDIA CUDA、AMD ROCm、Apple Metal 和 Intel XPU。此代幣發行消息是在 2025 年 6 月的測試階段之後發布的。

ME News 消息，4 月 15 日（UTC+8），據 1M AI News 監測，Hugging Face 執行長 Clem Delangue 宣布 Kernels 正式上線 Hub。GPU 算子是讓顯卡跑出極限速度的底層優化代碼，能將推理和訓練加速 1.7 至 2.5 倍，但安裝一直是噩夢：以最常用的 FlashAttention 為例，本地編譯需要約 96GB 記憶體和數小時，PyTorch 版本、CUDA 版本稍有不對就報錯，多數開發者在安裝這一步就卡住了。Kernels Hub 把編譯搬到雲端。Hugging Face 提前在各種顯卡和系統環境下編譯好算子，開發者寫一行代碼，Hub 自動匹配硬體環境，幾秒內下載預編譯檔案直接可用。同一進程可載入多個不同版本算子，兼容 torch.compile。Kernels 去年 6 月測試上線，本月升級為 Hub 一級倉庫類型，與 Models、Datasets、Spaces 並列。目前已有 61 個預編譯算子，覆蓋注意力機制、歸一化、混合專家路由、量化等常用場景，支援英偉達 CUDA、AMD ROCm、蘋果 Metal 和英特爾 XPU 四種硬體加速平台，已整合進 Hugging Face 的推理框架 TGI 和 Transformers 庫。（來源：BlockBeats）

來源:顯示原文

免責聲明：本頁面資訊可能來自第三方，不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用，不構成任何形式的陳述或保證，也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏，或因使用該資訊而導致的任何結果不承擔任何責任。虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息，請參閱我們的使用條款和風險披露。