xAI de Elon Musk conclui o treinamento do Grok V9-Medium, focando em programação complexa

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
A equipe da xAI, de Elon Musk, concluiu o treinamento do modelo Grok V9-Medium com 1,5 trilhão de parâmetros, segundo as últimas notícias on-chain. O modelo agora está entrando em fine-tuning supervisionado e começará o aprendizado por reforço em breve. A equipe adicionou uma grande quantia de código Cursor durante o treinamento e planeja mais. Em comparação com o modelo atual v8-small, que processa todo o tráfego de produção, espera-se que o Grok V9-Medium tenha desempenho muito superior em programação complexa. Musk já havia reconhecido falhas sérias nos dados de treinamento do modelo v8-small. A nova versão triplica a contagem de parâmetros e é otimizada para GPUs da arquitetura Blackwell, o que pode ajudar a melhorar a eficiência do processamento de dados de inflação no futuro.
ME AI mensagem, segundo monitoramento da Beating, Musk anunciou que o modelo base Grok V9-Medium com 1,5 trilhão de parâmetros da xAI concluiu o treinamento e está previsto para ser lançado ao público em 2 a 3 semanas. Atualmente, o modelo entrou na fase de fine-tuning supervisionado e iniciará o treinamento por aprendizado por reforço em poucos dias. A equipe de desenvolvimento incorporou grandes quantidades de dados de código do Cursor durante o treinamento complementar e continuará a adicionar mais amostras posteriormente. Em comparação com o modelo v8-small, que atualmente suporta todo o tráfego de produção do Grok, o Grok V9-Medium com 1,5 trilhão de parâmetros oferecerá uma melhoria significativa no processamento de tarefas de programação complexas. Anteriormente, Musk admitiu publicamente que o v8-small, com apenas 0,5 trilhão de parâmetros (ou seja, a versão de teste externo Grok 4.2), apresentava sérios defeitos na qualidade, abrangência e proporção dos dados de treinamento. O Grok V9-Medium concluído não apenas aumentou o número de parâmetros para três vezes o da versão anterior, mas também foi otimizado especificamente para a arquitetura GPU Blackwell. (Fonte: BlockBeats)
Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.