xAI de Elon Musk completa el entrenamiento de Grok V9-Medium, se enfoca en programación compleja

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
xAI, el equipo de Elon Musk, ha completado el entrenamiento del modelo Grok V9-Medium con 1,5 billones de parámetros, según las últimas noticias en cadena. El modelo ahora entra en un proceso de ajuste supervisado y comenzará pronto el aprendizaje por refuerzo. Durante el entrenamiento, el equipo añadió una gran cantidad de código Cursor y planea hacer más. En comparación con el modelo v8-small actual que maneja todo el tráfico de producción, se espera que Grok V9-Medium desempeñe mucho mejor en programación compleja. Musk había reconocido previamente serias fallas en los datos de entrenamiento del modelo v8-small. La nueva versión triplica la cantidad de parámetros y está optimizada para GPUs de arquitectura Blackwell, lo que podría ayudar a mejorar la eficiencia en el procesamiento de datos de inflación en el futuro.
ME AI mensaje, según el monitoreo de Beating, Musk anunció que el modelo base Grok V9-Medium de 1.5T parámetros de xAI ha completado su entrenamiento y se espera que se lance al público en 2 a 3 semanas. Actualmente, el modelo ha entrado en la fase de ajuste supervisado y comenzará el entrenamiento de aprendizaje por refuerzo en unos días. El equipo de desarrollo ha incorporado una gran cantidad de datos de código de Cursor durante el entrenamiento complementario y continuará incorporando más muestras en el futuro. En comparación con el modelo v8-small, que actualmente soporta todo el tráfico de producción de Grok, Grok V9-Medium con 1.5T parámetros logrará una mejora significativa en la ejecución de tareas de programación complejas. Anteriormente, Musk reconoció públicamente que el v8-small de solo 0.5T parámetros (es decir, la versión de prueba externa Grok 4.2) presentaba serios defectos en la calidad, exhaustividad y proporción de los datos de entrenamiento. Grok V9-Medium, una vez completado su entrenamiento, no solo ha aumentado su escala de parámetros hasta tres veces la del modelo anterior, sino que también ha sido optimizado específicamente para la arquitectura GPU Blackwell. (Fuente: BlockBeats)
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.