Hugging Face ra mắt Kernels Hub cho các bộ xử lý GPU đã được biên dịch sẵn

KuCoinFlash

Thời gian phát hành: 04:12:44 15/04/2026

Chia sẻ

Tóm tắt

CEO của Hugging Face, Clem Delangue, xác nhận việc ra mắt chính thức Kernels trên Hub vào ngày 15 tháng 4 (UTC+8), đánh dấu một sự kiện tin tức quan trọng trên chuỗi dành cho các nhà phát triển. Kernels cung cấp các bộ xử lý GPU đã được biên dịch sẵn, tăng tốc độ suy luận và huấn luyện lên 1,7 đến 2,5 lần. Các nhà phát triển hiện có thể cài đặt các bộ xử lý này chỉ bằng một dòng mã, với quá trình biên dịch trên đám mây được Hugging Face xử lý. Hub tự động khớp phần cứng và giao tệp trong vài giây. Hiện đã trở thành một loại kho cấp cao nhất, Kernels bao gồm 61 bộ xử lý cho các tác vụ phổ biến, hỗ trợ NVIDIA CUDA, AMD ROCm, Apple Metal và Intel XPU. Tin tức về việc ra mắt token đến sau giai đoạn beta vào tháng 6 năm 2025.

Tin tức từ ME News, ngày 15 tháng 4 (UTC+8), theo giám sát của 1M AI News, CEO của Hugging Face, Clem Delangue, đã công bố Kernels chính thức ra mắt trên Hub. Các GPU kernels là mã tối ưu hóa cấp底层 giúp tăng tốc độ card đồ họa đến giới hạn, có thể tăng tốc độ suy luận và huấn luyện từ 1,7 đến 2,5 lần, nhưng việc cài đặt luôn là cơn ác mộng: lấy FlashAttention – kernel phổ biến nhất – làm ví dụ, việc biên dịch cục bộ yêu cầu khoảng 96 GB bộ nhớ và vài giờ đồng hồ; chỉ cần phiên bản PyTorch hoặc CUDA không khớp là sẽ xảy ra lỗi, đa số nhà phát triển bị kẹt ngay ở bước cài đặt này. Kernels Hub chuyển quá trình biên dịch lên đám mây. Hugging Face đã biên dịch sẵn các kernels trên nhiều môi trường card đồ họa và hệ điều hành khác nhau; nhà phát triển chỉ cần viết một dòng mã, Hub sẽ tự động nhận diện môi trường phần cứng và tải về tệp đã biên dịch sẵn trong vài giây để sử dụng ngay. Một tiến trình có thể tải nhiều phiên bản kernels khác nhau đồng thời, tương thích với torch.compile. Kernels được thử nghiệm ra mắt vào tháng 6 năm ngoái và tháng này đã được nâng cấp thành loại kho cấp một trên Hub, cùng hàng với Models, Datasets và Spaces. Hiện đã có 61 kernels được biên dịch sẵn, bao phủ các kịch bản phổ biến như cơ chế chú ý, chuẩn hóa, định tuyến chuyên gia hỗn hợp, lượng tử hóa, hỗ trợ bốn nền tảng tăng tốc phần cứng: NVIDIA CUDA, AMD ROCm, Apple Metal và Intel XPU, và đã được tích hợp vào khung công cụ suy luận TGI và thư viện Transformers của Hugging Face. (Nguồn: BlockBeats)

Nguồn:Hiển thị bản gốc

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.