Hugging Face lanza Kernels Hub para operadores GPU precompilados

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
El CEO de Hugging Face, Clem Delangue, confirmó el lanzamiento oficial de Kernels en el Hub el 15 de abril (UTC+8), marcando un importante evento noticioso en la cadena para desarrolladores. Kernels ofrece operadores GPU precompilados, aumentando las velocidades de inferencia y entrenamiento entre 1.7 y 2.5 veces. Los desarrolladores pueden ahora instalar estos operadores con una sola línea de código, con la compilación en la nube gestionada por Hugging Face. El Hub empareja automáticamente el hardware y entrega los archivos en segundos. Ahora como un tipo de repositorio de nivel superior, Kernels incluye 61 operadores para tareas comunes, con soporte para NVIDIA CUDA, AMD ROCm, Apple Metal e Intel XPU. La noticia del lanzamiento del token sigue a una fase beta en junio de 2025.

Noticias de ME: el 15 de abril (UTC+8), según el monitoreo de 1M AI News, el CEO de Hugging Face, Clem Delangue, anunció que Kernels ya está oficialmente disponible en Hub. Los operadores GPU son códigos de optimización de bajo nivel que permiten a las tarjetas gráficas alcanzar su velocidad máxima, acelerando la inferencia y el entrenamiento entre 1.7 y 2.5 veces; sin embargo, su instalación siempre ha sido un calvario: por ejemplo, con FlashAttention, el más utilizado, la compilación local requiere aproximadamente 96 GB de memoria y varias horas, y cualquier discrepancia en la versión de PyTorch o CUDA genera errores, lo que detiene a la mayoría de los desarrolladores en esta etapa. Kernels Hub traslada la compilación a la nube. Hugging Face ha compilado previamente los operadores en diversos entornos de tarjetas gráficas y sistemas; los desarrolladores escriben una línea de código y Hub automáticamente detecta el entorno de hardware, descargando en segundos archivos precompilados listos para usar. Un mismo proceso puede cargar múltiples versiones de operadores distintos y es compatible con torch.compile. Kernels se lanzó en prueba en junio del año pasado y este mes se actualizó a un tipo de repositorio principal en Hub, junto con Models, Datasets y Spaces. Actualmente hay 61 operadores precompilados disponibles, que cubren escenarios comunes como mecanismos de atención, normalización, enrutamiento de expertos mixtos y cuantización, y admiten cuatro plataformas de aceleración de hardware: NVIDIA CUDA, AMD ROCm, Apple Metal e Intel XPU. Ya están integrados en el marco de inferencia TGI y la biblioteca Transformers de Hugging Face. (Fuente: BlockBeats)

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.