Hugging Face lance Kernels Hub pour les opérateurs GPU pré-compilés

KuCoinFlash

Date de parution : 15/04/2026 04:12:44

Résumé

Le PDG de Hugging Face, Clem Delangue, a confirmé la sortie officielle des Kernels sur le Hub le 15 avril (UTC+8), marquant un événement important sur la chaîne pour les développeurs. Kernels propose des opérateurs GPU pré-compilés, augmentant les vitesses d'inférence et d'entraînement de 1,7 à 2,5 fois. Les développeurs peuvent désormais installer ces opérateurs avec une seule ligne de code, la compilation cloud étant gérée par Hugging Face. Le Hub associe automatiquement le matériel et livre les fichiers en quelques secondes. Devenu un type de dépôt de premier niveau, Kernels inclut 61 opérateurs pour les tâches courantes, prenant en charge NVIDIA CUDA, AMD ROCm, Apple Metal et Intel XPU. Cette annonce de lancement de jeton suit une phase bêta en juin 2025.

Selon les nouvelles de ME, le 15 avril (UTC+8), selon les données de 1M AI News, le PDG de Hugging Face, Clem Delangue, a annoncé le lancement officiel de Kernels sur Hub. Les opérateurs GPU sont des codes d'optimisation de base permettant d'atteindre la vitesse maximale des cartes graphiques, accélérant l'inférence et l'entraînement de 1,7 à 2,5 fois. Toutefois, leur installation a toujours été un cauchemar : par exemple, pour FlashAttention, le plus couramment utilisé, la compilation locale nécessite environ 96 Go de mémoire et plusieurs heures ; une légère incompatibilité entre la version de PyTorch et celle de CUDA entraîne des erreurs, ce qui bloque la plupart des développeurs à cette étape. Kernels Hub déplace la compilation vers le cloud. Hugging Face a pré-compilé les opérateurs dans divers environnements de cartes graphiques et de systèmes ; les développeurs n'ont qu'à écrire une seule ligne de code, et Hub détecte automatiquement l'environnement matériel, téléchargeant en quelques secondes des fichiers pré-compilés prêts à l'emploi. Un même processus peut charger plusieurs versions d'opérateurs différents et est compatible avec torch.compile. Kernels a été mis en test en juin dernier et a été promu ce mois-ci au rang de type de dépôt principal sur Hub, aux côtés de Models, Datasets et Spaces. Actuellement, 61 opérateurs pré-compilés sont disponibles, couvrant des scénarios courants tels que les mécanismes d'attention, la normalisation, le routage des experts mixtes et la quantification. Ils prennent en charge quatre plateformes d'accélération matérielle : NVIDIA CUDA, AMD ROCm, Apple Metal et Intel XPU, et sont déjà intégrés au framework d'inférence TGI et à la bibliothèque Transformers de Hugging Face. (Source : BlockBeats)

Source:Afficher l'original

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.