Hugging Face lança o Kernels Hub para operadores GPU pré-compilados

KuCoinFlash

Data de lançamento: 15/04/2026, 04:12:44

Resumo

O CEO da Hugging Face, Clem Delangue, confirmou o lançamento oficial dos Kernels no Hub em 15 de abril (UTC+8), marcando um importante evento noticioso na cadeia para desenvolvedores. O Kernels oferece operadores GPU pré-compilados, aumentando as velocidades de inferência e treinamento em 1,7 a 2,5 vezes. Os desenvolvedores agora podem instalar esses operadores usando uma única linha de código, com a compilação baseada em nuvem gerenciada pela Hugging Face. O Hub automaticamente corresponde ao hardware e entrega os arquivos em segundos. Agora um tipo de repositório de nível superior, os Kernels incluem 61 operadores para tarefas comuns, com suporte a NVIDIA CUDA, AMD ROCm, Apple Metal e Intel XPU. A notícia do lançamento do token vem após uma fase beta em junho de 2025.

Notícia da ME, 15 de abril (UTC+8): segundo monitoramento da 1M AI News, o CEO da Hugging Face, Clem Delangue, anunciou o lançamento oficial do Kernels no Hub. Os operadores GPU são códigos de otimização de baixo nível que permitem que as placas gráficas atinjam sua velocidade máxima, acelerando a inferência e o treinamento em 1,7 a 2,5 vezes; no entanto, sua instalação sempre foi um pesadelo: por exemplo, o FlashAttention, o mais utilizado, exige cerca de 96 GB de memória e várias horas para compilação local, e qualquer discrepância nas versões do PyTorch ou CUDA gera erros — a maioria dos desenvolvedores é bloqueada nessa etapa de instalação. O Kernels Hub transfere a compilação para a nuvem. A Hugging Face já compila previamente os operadores em diversos ambientes de placas gráficas e sistemas; os desenvolvedores escrevem uma única linha de código, e o Hub automaticamente detecta o ambiente de hardware e baixa os arquivos pré-compilados em segundos, prontos para uso. O mesmo processo pode carregar múltiplos operadores de versões diferentes, com compatibilidade total com torch.compile. O Kernels foi lançado em teste em junho do ano passado e foi atualizado este mês para se tornar um tipo de repositório principal no Hub, ao lado de Models, Datasets e Spaces. Atualmente, já existem 61 operadores pré-compilados, cobrindo cenários comuns como mecanismos de atenção, normalização, roteamento de especialistas mistos e quantização, com suporte às quatro plataformas de aceleração de hardware: NVIDIA CUDA, AMD ROCm, Apple Metal e Intel XPU, já integrados ao framework de inferência TGI e à biblioteca Transformers da Hugging Face. (Fonte: BlockBeats)

Fonte:Mostrar original

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.