xAI de Musk conclui o treinamento do Grok V9-Medium, focando em programação complexa

icon MarsBit
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
A xAI de Elon Musk concluiu o treinamento do modelo Grok V9-Medium com 1,5 trilhão de parâmetros, com lançamento público previsto para daqui a 2 a 3 semanas. O modelo está agora em fine-tuning supervisionado, com aprendizado por reforço a seguir. A equipe adicionou dados de código do Cursor durante o treinamento e planeja expandir o conjunto de dados. Em comparação com o modelo v8-small, que gerencia todo o tráfego do Grok, a nova versão melhora o desempenho em programação complexa. Musk apontou falhas nos dados de treinamento do v8-small. O Grok V9-Medium triplica a contagem de parâmetros e é otimizado para GPUs Blackwell. Notícias on-chain mostram crescente interesse em ferramentas impulsionadas por IA, enquanto os dados de inflação permanecem como um fator macroeconômico chave para os mercados de criptomoedas.

De acordo com o monitoramento da Beating, Musk anunciou que o modelo base Grok V9-Medium, com 1,5 trilhão de parâmetros da xAI, concluiu o treinamento e está previsto para ser lançado ao público em 2 a 3 semanas. Atualmente, o modelo entrou na fase de fine-tuning supervisionado e iniciará o treinamento por reforço em poucos dias. A equipe de desenvolvimento incorporou grandes volumes de dados de código do Cursor durante o treinamento complementar e continuará a integrar mais amostras no futuro. Em comparação com o modelo v8-small, que atualmente suporta todo o tráfego de produção do Grok, o Grok V9-Medium com 1,5 trilhão de parâmetros oferecerá uma melhoria significativa no processamento de tarefas de programação complexas. Anteriormente, Musk reconheceu publicamente que o v8-small, com apenas 0,5 trilhão de parâmetros (ou seja, a versão de teste externo Grok 4.2), apresentava sérias deficiências na qualidade, abrangência e proporção dos dados de treinamento. O Grok V9-Medium concluído não apenas aumentou sua escala de parâmetros para três vezes a do modelo anterior, mas também foi otimizado especificamente para a arquitetura GPU Blackwell.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.