Odaily Planet Daily : Récemment, l'équipe du projet de plateforme d'entraînement IA de la Shenzhen Hekou University, en collaboration avec l'Université des sciences et technologies de Harbin (sucursale de Shenzhen), l'Institut des grands données de Shenzhen et les équipes de Huawei, a mené conjointement des recherches avec la plateforme de calcul IA de Shenzhen Zhi Cheng, dans le cadre de l'entraînement de modèles de calcul chinois. En s'appuyant sur le cluster de calcul IA domestique Ascend 910C, elles ont accompli l'entraînement complet des paramètres du modèle à 1,6 billion de paramètres DeepSeek-V4-Pro.
Cette expérience a permis d'accumuler des connaissances essentielles sur la formation de modèles de ce niveau sur des plateformes de calcul nationales par des organismes tiers mondiaux, et a confirmé que les puces IA nationales peuvent soutenir l'entraînement de modèles ultragrands à paramètres mondiaux. Du point de vue de l'application technologique, l'utilisation de modèles existants pour l'inférence commerciale et l'entraînement complet de tous les paramètres d'un modèle à partir de zéro relèvent de deux étapes technologiques distinctes, avec des différences marquées en termes de complexité technique et de exigences matérielles. Les résultats de cet essai démontrent que le calcul IA national est désormais capable de prendre en charge des tâches d'entraînement de modèles de pointe, et que la voie technologique associée est faisable. (Publication de Shenzhen)
