Hugging Face запускает Kernels Hub для предварительно скомпилированных GPU-операторов

KuCoinFlash

Время выхода: 15.04.2026, 04:12:44

Сводка

Генеральный директор Hugging Face Клем Деланг подтвердил официальный релиз Kernels на Hub 15 апреля (UTC+8), что стало значимым событием в блокчейне для разработчиков. Kernels предлагает предварительно скомпилированные GPU-операторы, увеличивающие скорость вывода и обучения в 1,7–2,5 раза. Разработчики теперь могут установить эти операторы с помощью одной строки кода, при этом компиляция в облаке осуществляется Hugging Face. Hub автоматически подбирает оборудование и доставляет файлы за несколько секунд. Kernels теперь является отдельным типом репозитория и включает 61 оператор для распространённых задач, поддерживая NVIDIA CUDA, AMD ROCm, Apple Metal и Intel XPU. Новость о запуске токена последовала после бета-фазы в июне 2025 года.

Согласно новости ME, 15 апреля (UTC+8), по данным 1M AI News, генеральный директор Hugging Face Клем Деланж объявил о официальном запуске Kernels на Hub. GPU-операторы — это низкоуровневый оптимизационный код, позволяющий добиться максимальной скорости работы видеокарт, ускоряющий вывод и обучение в 1,7–2,5 раза, но их установка всегда была кошмаром: например, для наиболее популярного FlashAttention локальная компиляция требует около 96 ГБ оперативной памяти и нескольких часов, а даже незначительное несоответствие версий PyTorch или CUDA приводит к ошибкам — большинство разработчиков застревают именно на этом этапе установки. Kernels Hub переносит компиляцию в облако. Hugging Face заранее скомпилировал операторы для различных конфигураций видеокарт и операционных систем; разработчику достаточно написать одну строку кода — Hub автоматически определяет аппаратную среду и за несколько секунд загружает предварительно скомпилированный файл, готовый к использованию. В одном процессе можно загружать несколько версий операторов, совместимых с torch.compile. Kernels были запущены в тестовом режиме в июне прошлого года, а в этом месяце были повышены до уровня основных репозиториев Hub, став равноправными с Models, Datasets и Spaces. На данный момент доступно 61 предварительно скомпилированный оператор, охватывающий распространённые сценарии, такие как механизмы внимания, нормализация, маршрутизация смешанных экспертов и квантование; поддерживается четыре платформы аппаратного ускорения: NVIDIA CUDA, AMD ROCm, Apple Metal и Intel XPU. Kernels уже интегрированы в фреймворк TGI и библиотеку Transformers от Hugging Face. (Источник: BlockBeats)

Источник:Показать оригинал

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.