Cohere lance le modèle open source de codage North Mini Code avec 30 milliards de paramètres

iconCryptoBriefing
Partager
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRésumé

expand icon
Cohere a lancé North Mini Code 1.0, un modèle open-source de codage de 30 milliards de paramètres sous Apache 2.0 le 9 juin. Ce modèle MoE active 3 milliards de paramètres à la fois, réduisant les coûts d'inférence tout en prenant en charge un contexte de 256K jetons et une sortie de 64K. Il a obtenu un score de 27,6 sur l'indice d'intelligence d'analyse artificielle, séduisant les développeurs utilisant l'analyse sur chaîne pour l'IA sur site. L'intérêt ouvert pour les modèles de qualité entreprise augmente alors que les entreprises recherchent des solutions évolutives.

Cohere vient de lancer son premier modèle de codage agentic open-source, et son architecture révèle tout sur la direction prise par la course à l'IA entreprise. North Mini Code 1.0, un modèle Mixture-of-Experts de 30 milliards de paramètres, a été publié le 9 juin sous licence Apache 2.0, le rendant librement disponible sur Hugging Face pour toute personne souhaitant exécuter un assistant de codage performant sans communiquer avec le cloud d'un tiers.

Le modèle a obtenu 27,6 sur l'indice d'intelligence d'analyse artificielle, un référentiel visant à standardiser la comparaison des modèles d'IA selon leurs capacités.

Le piège MoE qui rend cela possible

North Mini Code achemine chaque requête vers un petit sous-ensemble de réseaux « experts » spécialisés au sein du modèle plus vaste, avec 30 milliards de paramètres au total, mais seulement 3 milliards actifs à tout moment, réduisant considérablement les coûts d'inférence par rapport à un modèle dense de 30 milliards.

Publicité

Le modèle prend en charge une longueur de contexte de 256 000 jetons et peut générer des sorties jusqu'à 64 000 jetons. Pour donner un point de référence, 256 000 jetons équivalent environ à fournir au modèle une base de code de taille moyenne entière et lui demander de comprendre les relations entre les fichiers, les fonctions et les dépendances. La limite de sortie de 64 000 jetons signifie qu'il peut générer de grands blocs de code en une seule passe, sans nécessiter que les développeurs enchaînent plusieurs réponses plus courtes.

Le cofondateur de Cohere, Nick Frosst, a dévoilé le modèle sur les réseaux sociaux quelques jours avant le lancement, avec un accès anticipé pour la communauté qui a commencé vers le 6-7 juin, avant la sortie publique complète le 9 juin.

Pourquoi open-source, et pourquoi maintenant

La licence Apache 2.0 est l'une des plus permissives dans le domaine du logiciel open source, ce qui permet aux entreprises de modifier, déployer et même commercialiser le modèle sans problèmes de licence. Pour un CTO d'une institution financière qui a été informé par la conformité qu'aucune donnée propriétaire ne doit quitter les locaux, c'est ce type de modèle qui passe réellement l'examen juridique.

La sortie intervient à moins de trois semaines après le lancement de Command A+, son modèle précédent, le 20 mai. Command A+ a obtenu un score de 37 sur l'indice d'intelligence d'Artificial Analysis. Ce rythme suggère que l'entreprise accélère son calendrier de publication.

Ce que cela signifie pour les investisseurs et le marché dans son ensemble

La répartition totale de 30 milliards, avec 3 milliards de paramètres actifs, permet aux organisations de faire fonctionner ce modèle sur un matériel nettement moins puissant qu'un modèle dense comparable, réduisant potentiellement les besoins en GPU qui ont rendu l'adoption de l'IA entreprise coûteuse et logistiquement complexe.

La question plus large pour quiconque suit le secteur de l'IA est de savoir si les modèles de codage spécialisés vont se concentrer autour de quelques gagnants ou continuer à se fragmenter. La fenêtre de contexte de 256K et la longueur de sortie de 64K de North Mini Code suggèrent que Cohere cible des flux de travail agents, où les modèles d'IA ne se contentent pas de compléter automatiquement une ligne de code, mais planifient, exécutent et itèrent sur des tâches entières d'ingénierie logicielle.

Clause de non-responsabilité : les informations sur cette page peuvent avoir été obtenues auprès de tiers et ne reflètent pas nécessairement les points de vue ou opinions de KuCoin. Ce contenu est fourni à titre informatif uniquement, sans aucune représentation ou garantie d’aucune sorte, et ne doit pas être interprété comme un conseil en investissement. KuCoin ne sera pas responsable des erreurs ou omissions, ni des résultats résultant de l’utilisation de ces informations. Les investissements dans les actifs numériques peuvent être risqués. Veuillez évaluer soigneusement les risques d’un produit et votre tolérance au risque en fonction de votre propre situation financière. Pour plus d’informations, veuillez consulter nos conditions d’utilisation et divulgation des risques.