A equipe de Shenzhen treina modelo de IA com 1,6 trilhão de parâmetros usando chip nacional

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
Uma equipe baseada em Shenzhen treinou o modelo DeepSeek-V4-Pro com 1,6 trilhão de parâmetros usando o cluster de computação de IA Ascend 910C da Huawei. O projeto envolveu o Shenzhen HeTao College, o Instituto de Tecnologia de Harbin (Shenzhen) e o Instituto Shenzhen de Big Data. O sucesso demonstra um alto nível de suporte para chips de IA nacionais no treinamento de modelos ultra-grandes. A conquista está alinhada às tendências recentes dos dados de inflação, destacando o papel crescente da tecnologia local no desenvolvimento de IA.

Odaily Planet Daily News: Recentemente, a equipe do projeto de plataforma de treinamento de IA da Shenzhen Hekou College, em colaboração com a Universidade de Ciência e Tecnologia da China (Shenzhen), o Instituto de Pesquisa de Grandes Dados de Shenzhen e equipes da Huawei, em conjunto com a plataforma de capacidade de cálculo de IA da Shenzhen Smart City, realizou esforços conjuntos para o treinamento de modelos de grande linguagem em capacidade de cálculo nacional. Utilizando o cluster de capacidade de cálculo de IA Ascend 910C nacional, concluíram o pós-treinamento completo de parâmetros do modelo de grande linguagem DeepSeek-V4-Pro com 1,6 trilhões de parâmetros.

Esta prática acumulou experiência importante na exploração de treinamento de modelos desse nível por instituições terceirizadas globais em plataformas de computação nacional, além de confirmar que os chips de IA nacionais podem suportar o treinamento de modelos de parâmetros ultra-grandes de nível mundial. Do ponto de vista da aplicação técnica, invocar modelos existentes para inferência de negócios e realizar o treinamento completo de todos os parâmetros do modelo do zero pertencem a diferentes etapas técnicas, com diferenças claras em termos de complexidade técnica e requisitos de hardware. Os resultados deste experimento demonstram que a capacidade de computação de IA nacional já pode assumir tarefas de treinamento de modelos de ponta, e que a trajetória tecnológica correspondente é viável. (Shenzhen Release)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.