Selon les données de Beating, Elon Musk a annoncé que le modèle de base Grok V9-Medium, doté de 1,5 trillion de paramètres, a terminé son entraînement et devrait être publié au grand public dans les 2 à 3 semaines à venir. Le modèle est actuellement en phase de micro-adaptation supervisée, et l'entraînement par apprentissage par renforcement débutera dans quelques jours. L'équipe de développement a intégré un grand volume de données de code provenant de Cursor lors de l'entraînement complémentaire et prévoit d'ajouter davantage d'échantillons ultérieurement. Par rapport au modèle v8-small, qui supporte actuellement tout le trafic de production de Grok, Grok V9-Medium, avec ses 1,5 trillion de paramètres, offrira une amélioration significative dans la gestion de tâches de programmation complexes. Elon Musk avait précédemment reconnu publiquement que le modèle v8-small, doté de seulement 0,5 trillion de paramètres (la version bêta Grok 4.2), présentait des défauts graves en termes de qualité, de complétude et de proportion des données d'entraînement. Le modèle Grok V9-Medium, une fois entièrement entraîné, non seulement triple la taille des paramètres par rapport à sa précédente version, mais a également été spécifiquement optimisé pour l'architecture GPU Blackwell.
xAI de Musk termine l'entraînement de Grok V9-Medium, se concentre sur la programmation complexe
MarsBitPartager






xAI d'Elon Musk a terminé l'entraînement du modèle Grok V9-Medium de 1,5 billion de paramètres, dont la sortie publique est prévue dans 2 à 3 semaines. Le modèle est actuellement en fine-tuning supervisé, avec un apprentissage par renforcement à venir. L'équipe a intégré des données de code Cursor pendant l'entraînement et prévoit d'élargir l'ensemble de données. Par rapport au modèle v8-small, qui gère tout le trafic Grok, cette nouvelle version améliore les performances en programmation complexe. Musk a souligné des défauts dans les données d'entraînement du v8-small. Grok V9-Medium triple le nombre de paramètres et est optimisé pour les GPU Blackwell. Les informations chainées montrent un intérêt croissant pour les outils pilotés par l'IA, tandis que les données sur l'inflation restent un facteur macroéconomique clé pour les marchés cryptos.
Source:Afficher l'original
Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations.
Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.