Odaily Planet Daily News: Recentemente, a equipe do projeto de plataforma de treinamento de IA da Shenzhen Hekou College, em colaboração com a Universidade de Ciência e Tecnologia da China (Shenzhen), o Instituto de Pesquisa de Grandes Dados de Shenzhen e equipes da Huawei, em conjunto com a plataforma de capacidade de cálculo de IA da Shenzhen Smart City, realizou esforços conjuntos para o treinamento de modelos de grande linguagem em capacidade de cálculo nacional. Utilizando o cluster de capacidade de cálculo de IA Ascend 910C nacional, concluíram o pós-treinamento completo de parâmetros do modelo de grande linguagem DeepSeek-V4-Pro com 1,6 trilhões de parâmetros.
Esta prática acumulou experiência importante na exploração de treinamento de modelos desse nível por instituições terceirizadas globais em plataformas de computação nacional, além de confirmar que os chips de IA nacionais podem suportar o treinamento de modelos de parâmetros ultra-grandes de nível mundial. Do ponto de vista da aplicação técnica, invocar modelos existentes para inferência de negócios e realizar o treinamento completo de todos os parâmetros do modelo do zero pertencem a diferentes etapas técnicas, com diferenças claras em termos de complexidade técnica e requisitos de hardware. Os resultados deste experimento demonstram que a capacidade de computação de IA nacional já pode assumir tarefas de treinamento de modelos de ponta, e que a trajetória tecnológica correspondente é viável. (Shenzhen Release)
