L'équipe de Shenzhen forme un modèle d'IA de 1,6 billion de paramètres en utilisant une puce nationale

iconKuCoinFlash
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Une équipe basée à Shenzhen a formé le modèle DeepSeek-V4-Pro de 1,6 billion de paramètres en utilisant le cluster de calcul IA Ascend 910C de Huawei. Le projet a impliqué le Collège HeTao de Shenzhen, l'Institut des technologies de Harbin (Shenzhen) et l'Institut shenzhenais des grands données. Ce succès démontre un fort soutien aux puces IA nationales pour l'entraînement de modèles ultra-grands. Cette réalisation s'aligne sur les tendances récentes des données d'inflation, mettant en lumière le rôle croissant de la technologie locale dans le développement de l'IA.

Odaily Planet Daily : Récemment, l'équipe du projet de plateforme d'entraînement IA de la Shenzhen Hekou University, en collaboration avec l'Université des sciences et technologies de Harbin (sucursale de Shenzhen), l'Institut des grands données de Shenzhen et les équipes de Huawei, a mené conjointement des recherches avec la plateforme de calcul IA de Shenzhen Zhi Cheng, dans le cadre de l'entraînement de modèles de calcul chinois. En s'appuyant sur le cluster de calcul IA domestique Ascend 910C, elles ont accompli l'entraînement complet des paramètres du modèle à 1,6 billion de paramètres DeepSeek-V4-Pro.

Cette expérience a permis d'accumuler des connaissances essentielles sur la formation de modèles de ce niveau sur des plateformes de calcul nationales par des organismes tiers mondiaux, et a confirmé que les puces IA nationales peuvent soutenir l'entraînement de modèles ultragrands à paramètres mondiaux. Du point de vue de l'application technologique, l'utilisation de modèles existants pour l'inférence commerciale et l'entraînement complet de tous les paramètres d'un modèle à partir de zéro relèvent de deux étapes technologiques distinctes, avec des différences marquées en termes de complexité technique et de exigences matérielles. Les résultats de cet essai démontrent que le calcul IA national est désormais capable de prendre en charge des tâches d'entraînement de modèles de pointe, et que la voie technologique associée est faisable. (Publication de Shenzhen)

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.