Hugging Face запускає Kernels Hub для попередньо скомпільованих GPU-операторів

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Генеральний директор Hugging Face Клем Деланж підтвердив офіційний реліз Kernels на Hub 15 квітня (UTC+8), що стало значною подією в он-чейн новинах для розробників. Kernels пропонує попередньо скомпільовані GPU-оператори, що збільшують швидкість висновку та навчання в 1,7–2,5 рази. Розробники тепер можуть встановити ці оператори за допомогою однієї команди коду, а хмарна компіляція виконується Hugging Face. Hub автоматично визначає апаратне забезпечення та надсилає файли за кілька секунд. Тепер Kernels — це тип репозиторію верхнього рівня, який містить 61 оператор для поширених завдань і підтримує NVIDIA CUDA, AMD ROCm, Apple Metal та Intel XPU. Новина про запуск токена з’явилася після бета-фази у червні 2025 року.

ME News: 15 квітня (UTC+8), за даними 1M AI News, генеральний директор Hugging Face Клем Деланж оголосив про офіційний запуск Kernels на Hub. GPU-оператори — це низькорівневий оптимізаційний код, який дозволяє вивести графічні процесори на максимальну швидкість, прискорюючи висновки та навчання в 1,7–2,5 рази. Однак їх встановлення завжди було кошмаром: наприклад, для найпоширенішого FlashAttention локальна компіляція вимагає близько 96 ГБ оперативної пам’яті та кілька годин; навіть невеликі розбіжності у версіях PyTorch або CUDA призводять до помилок, і більшість розробників застрягають саме на цьому етапі. Kernels Hub переносить компіляцію до хмари. Hugging Face заздалегідь скомпілював оператори для різних конфігурацій графічних процесорів та операційних систем, і розробникам достатньо написати один рядок коду — Hub автоматично визначає середовище апаратного забезпечення та за кілька секунд завантажує вже скомпільовані файли, готові до використання. У одному процесі можна завантажити кілька версій операторів, що сумісні з torch.compile. Kernels були запущені у тестовому режимі у червні минулого року, а цього місяця їх було піднято до рівня першого класу репозиторіїв Hub, поставивши їх у один ряд з Models, Datasets та Spaces. На даний момент доступно 61 попередньо скомпільований оператор, що охоплює поширені сценарії, такі як увага, нормалізація, маршрутизація мішаних експертів та квантування. Підтримуються чотири платформи апаратного прискорення: NVIDIA CUDA, AMD ROCm, Apple Metal та Intel XPU. Kernels вже інтегровано в інфраструктуру TGI та бібліотеку Transformers від Hugging Face. (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.