Hugging Face запускає Kernels Hub для попередньо скомпільованих GPU-операторів

KuCoinFlash

Час випуску: 15.04.2026, 04:12:44

Поділитися

Короткий зміст

Генеральний директор Hugging Face Клем Деланж підтвердив офіційний реліз Kernels на Hub 15 квітня (UTC+8), що стало значною подією в он-чейн новинах для розробників. Kernels пропонує попередньо скомпільовані GPU-оператори, що збільшують швидкість висновку та навчання в 1,7–2,5 рази. Розробники тепер можуть встановити ці оператори за допомогою однієї команди коду, а хмарна компіляція виконується Hugging Face. Hub автоматично визначає апаратне забезпечення та надсилає файли за кілька секунд. Тепер Kernels — це тип репозиторію верхнього рівня, який містить 61 оператор для поширених завдань і підтримує NVIDIA CUDA, AMD ROCm, Apple Metal та Intel XPU. Новина про запуск токена з’явилася після бета-фази у червні 2025 року.

ME News: 15 квітня (UTC+8), за даними 1M AI News, генеральний директор Hugging Face Клем Деланж оголосив про офіційний запуск Kernels на Hub. GPU-оператори — це низькорівневий оптимізаційний код, який дозволяє вивести графічні процесори на максимальну швидкість, прискорюючи висновки та навчання в 1,7–2,5 рази. Однак їх встановлення завжди було кошмаром: наприклад, для найпоширенішого FlashAttention локальна компіляція вимагає близько 96 ГБ оперативної пам’яті та кілька годин; навіть невеликі розбіжності у версіях PyTorch або CUDA призводять до помилок, і більшість розробників застрягають саме на цьому етапі. Kernels Hub переносить компіляцію до хмари. Hugging Face заздалегідь скомпілював оператори для різних конфігурацій графічних процесорів та операційних систем, і розробникам достатньо написати один рядок коду — Hub автоматично визначає середовище апаратного забезпечення та за кілька секунд завантажує вже скомпільовані файли, готові до використання. У одному процесі можна завантажити кілька версій операторів, що сумісні з torch.compile. Kernels були запущені у тестовому режимі у червні минулого року, а цього місяця їх було піднято до рівня першого класу репозиторіїв Hub, поставивши їх у один ряд з Models, Datasets та Spaces. На даний момент доступно 61 попередньо скомпільований оператор, що охоплює поширені сценарії, такі як увага, нормалізація, маршрутизація мішаних експертів та квантування. Підтримуються чотири платформи апаратного прискорення: NVIDIA CUDA, AMD ROCm, Apple Metal та Intel XPU. Kernels вже інтегровано в інфраструктуру TGI та бібліотеку Transformers від Hugging Face. (Джерело: BlockBeats)

Джерело:Показати оригінал

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.