Moonshot AI lance Kimi-K2.7-Code avec 1 billion de paramètres

Moonshot AI vient de lancer Kimi-K2.7-Code, un modèle de codage open-source conçu pour rendre la programmation assistée par l’IA moins gourmande et plus performante. L’entreprise basée à Pékin affirme que ce modèle réduit l’utilisation de jetons de raisonnement de 30 % par rapport à son prédécesseur, ce qui signifie concrètement que les développeurs consomment moins de ressources informatiques tout en obtenant de meilleurs résultats.

Le modèle est en ligne sur les API de la plateforme Kimi de Moonshot AI et hébergé sur Hugging Face sous une licence MIT modifiée. Cette licence autorise l'utilisation commerciale avec attribution pour les déploiements à grande échelle, un détail important pour toute entreprise envisageant de construire des produits basés dessus.

Les chiffres derrière la mise à niveau

Kimi-K2.7-Code est une architecture Mixture-of-Experts regroupant 1 billion de paramètres au total avec 32 milliards de paramètres actifs.

Les améliorations par rapport au modèle précédent K2.6 sont difficiles à ignorer. Moonshot AI signale une augmentation de 21,8 % sur Kimi Code Bench v2, une amélioration de 11,0 % sur Program Bench et une hausse de 31,5 % sur MLS Bench Lite.

Ce dernier chiffre est particulièrement frappant. MLS Bench Lite évalue les capacités de prise en charge des langues multiples, ce qui signifie que le modèle gère les tâches à travers des langages de programmation comme Python, Rust et Go avec une précision significativement améliorée par rapport à avant.

La réduction de 30 % des jetons de raisonnement résout ce que les chercheurs appellent le « surréflexion », un problème courant dans les environnements de codage automatisé. Lorsqu'un modèle d'IA utilise trop de jetons pour raisonner à travers un problème, il consomme des ressources informatiques, augmente la latence et fait grimper les coûts d'API pour les développeurs.

De la startup de chatbot à la puissance open-source

Moonshot AI a été fondée en 2023 par Zhilin Yang, ancien de l'Université Tsinghua, qui a construit l'entreprise autour de son chatbot Kimi. Le virage vers la publication de modèles à poids ouverts a commencé avec la série K2 au milieu de 2025, et le rythme d'itération depuis lors a été ininterrompu.

Le modèle de base K2 a été lancé en juillet 2025. K2 Thinking a suivi en novembre 2025, en ajoutant des capacités de raisonnement améliorées. K2.5 est arrivé en janvier 2026, et K2.6 est arrivé en avril 2026. Maintenant, K2.7-Code débarque en juin 2026, devenant la cinquième version majeure en moins d'un an.

L'entreprise a structuré ses modèles autour de trois piliers : les capacités agentes, la gestion de contexte étendu et les entrées multimodales. K2.7-Code s'appuie fortement sur les deux premiers, conçu pour des scénarios où un agent IA doit planifier, exécuter et déboguer du code sur de longues séquences.