Les guerres du codage par IA viennent de gagner un nouveau leader de prix. Kimi 2.7 de Moonshot AI, également connu sous le nom de K2.7 Code, se positionne comme l’alternative économique à Claude Fable 5 d’Anthropic, l’un des modèles de codage les plus performants du marché. La proposition est simple : obtenir des performances presque identiques pour une fraction du coût.
Les tarifs de l'API de Kimi 2.7 s'établissent à 0,95 $ par million de jetons d'entrée et 4,00 $ par million de jetons de sortie, avec une facturation de seulement 0,19 $ par million de jetons pour les hits de cache.
Ce que Kimi 2.7 apporte à la table
En coulisses, Kimi 2.7 repose sur une architecture Mixture-of-Experts. Le modèle compte jusqu'à un trillion de paramètres au total, mais seulement 32 milliards sont actifs à tout moment. Cette conception lui permet de dépasser ses performances attendues tout en gardant les coûts computationnels maîtrisés.
Les points forts du modèle sont la fiabilité sur de longs contextes et des taux de réussite plus élevés pour les tâches. Pour les développeurs travaillant sur des problèmes d'ingénierie logicielle réels, où les fichiers sont longs et les dépendances complexes, cette fiabilité est plus importante que les scores bruts sur des problèmes simplifiés.
Moonshot AI, le laboratoire basé à Pékin derrière la série de modèles K2, monte régulièrement en puissance dans la course aux modèles de pointe. Kimi 2.7 représente leur tentative la plus audacieuse jusqu'à présent dans l'espace de l'IA dédiée à la programmation, un domaine de plus en plus dominé par des laboratoires occidentaux comme Anthropic, OpenAI et Google DeepMind.
Le modèle qu'elle poursuit
Claude Fable 5, publié le 9 juin 2026, a établi une référence élevée. Le dernier modèle d'Anthropic a franchi le seuil de 90 % sur les indicateurs d'analyse de base, une étape qui représente un progrès significatif en matière de performance en ingénierie logicielle et en tâches analytiques.
Moonshot AI suppose que la plupart des développeurs n'ont pas besoin du modèle le plus performant au monde. Si Kimi 2.7 peut offrir des capacités de codage compétitives à un prix qui n'exige pas de réunion d'examen budgétaire chaque trimestre, les chiffres deviennent très attractifs pour les startups, les développeurs indépendants et les équipes d'ingénierie de taille moyenne.
Le tableau d'ensemble de la concurrence dans l'IA
L'échelle du trillion de paramètres de l'architecture complète de Kimi 2.7 la place dans la même catégorie que les plus grands modèles de n'importe quel laboratoire mondial. L'approche Mixture-of-Experts, qui active uniquement 32 milliards de paramètres par requête, rend possible une offre à un prix d'entrée inférieur à un dollar.
Claude Fable 5 reste la référence en matière de performance brute en codage, particulièrement sur les tâches analytiques complexes où ses scores supérieurs à 90 % parlent d'eux-mêmes. Toutefois, Kimi 2.7 constitue une alternative viable pour les équipes disposant de budgets de jetons limités et de charges de travail à fort volume.
Le prix de hit cache à 0,19 $ par million de jetons est particulièrement remarquable pour les applications en production. Les développeurs qui structurent leurs flux de travail pour maximiser la réutilisation du cache pourraient voir leurs coûts effectifs diminuer considérablement, faisant de Kimi 2.7 l'un des modèles de codage de pointe les moins chers disponibles pour les tâches répétitives ou basées sur des modèles.
