Cohere vient de lancer son premier modèle de codage agentic open-source, et son architecture révèle tout sur la direction prise par la course à l'IA entreprise. North Mini Code 1.0, un modèle Mixture-of-Experts de 30 milliards de paramètres, a été publié le 9 juin sous licence Apache 2.0, le rendant librement disponible sur Hugging Face pour toute personne souhaitant exécuter un assistant de codage performant sans communiquer avec le cloud d'un tiers.
Le modèle a obtenu 27,6 sur l'indice d'intelligence d'analyse artificielle, un référentiel visant à standardiser la comparaison des modèles d'IA selon leurs capacités.
Le piège MoE qui rend cela possible
North Mini Code achemine chaque requête vers un petit sous-ensemble de réseaux « experts » spécialisés au sein du modèle plus vaste, avec 30 milliards de paramètres au total, mais seulement 3 milliards actifs à tout moment, réduisant considérablement les coûts d'inférence par rapport à un modèle dense de 30 milliards.
Le modèle prend en charge une longueur de contexte de 256 000 jetons et peut générer des sorties jusqu'à 64 000 jetons. Pour donner un point de référence, 256 000 jetons équivalent environ à fournir au modèle une base de code de taille moyenne entière et lui demander de comprendre les relations entre les fichiers, les fonctions et les dépendances. La limite de sortie de 64 000 jetons signifie qu'il peut générer de grands blocs de code en une seule passe, sans nécessiter que les développeurs enchaînent plusieurs réponses plus courtes.
Le cofondateur de Cohere, Nick Frosst, a dévoilé le modèle sur les réseaux sociaux quelques jours avant le lancement, avec un accès anticipé pour la communauté qui a commencé vers le 6-7 juin, avant la sortie publique complète le 9 juin.
Pourquoi open-source, et pourquoi maintenant
La licence Apache 2.0 est l'une des plus permissives dans le domaine du logiciel open source, ce qui permet aux entreprises de modifier, déployer et même commercialiser le modèle sans problèmes de licence. Pour un CTO d'une institution financière qui a été informé par la conformité qu'aucune donnée propriétaire ne doit quitter les locaux, c'est ce type de modèle qui passe réellement l'examen juridique.
La sortie intervient à moins de trois semaines après le lancement de Command A+, son modèle précédent, le 20 mai. Command A+ a obtenu un score de 37 sur l'indice d'intelligence d'Artificial Analysis. Ce rythme suggère que l'entreprise accélère son calendrier de publication.
Ce que cela signifie pour les investisseurs et le marché dans son ensemble
La répartition totale de 30 milliards, avec 3 milliards de paramètres actifs, permet aux organisations de faire fonctionner ce modèle sur un matériel nettement moins puissant qu'un modèle dense comparable, réduisant potentiellement les besoins en GPU qui ont rendu l'adoption de l'IA entreprise coûteuse et logistiquement complexe.
La question plus large pour quiconque suit le secteur de l'IA est de savoir si les modèles de codage spécialisés vont se concentrer autour de quelques gagnants ou continuer à se fragmenter. La fenêtre de contexte de 256K et la longueur de sortie de 64K de North Mini Code suggèrent que Cohere cible des flux de travail agents, où les modèles d'IA ne se contentent pas de compléter automatiquement une ligne de code, mais planifient, exécutent et itèrent sur des tâches entières d'ingénierie logicielle.
