Moonshot AI acaba de lanzar Kimi-K2.7-Code, un modelo de codificación de código abierto diseñado para hacer la programación asistida por IA menos consumista y más capaz. La empresa con sede en Pekín afirma que el modelo reduce el uso de tokens de razonamiento en un 30% en comparación con su predecesor, lo que, en términos prácticos, significa que los desarrolladores consumen menos recursos de cómputo mientras obtienen mejores resultados.
El modelo está activo en las API de la plataforma Kimi de Moonshot AI y alojado en Hugging Face bajo una licencia MIT modificada. Esta licencia permite el uso comercial con atribución para implementaciones a gran escala, un detalle que es relevante para cualquier empresa que considere construir productos sobre él.
Los números detrás de la actualización
Kimi-K2.7-Code es una arquitectura Mixture-of-Experts con un total de 1 billón de parámetros y 32 mil millones de parámetros activos.
Las mejoras en el rendimiento respecto al modelo anterior K2.6 son difíciles de ignorar. Moonshot AI informa una ganancia del 21,8% en Kimi Code Bench v2, una mejora del 11,0% en Program Bench y un aumento del 31,5% en MLS Bench Lite.
Ese último número es particularmente llamativo. MLS Bench Lite prueba las capacidades de soporte multilingüe, lo que significa que el modelo maneja tareas en lenguajes de programación como Python, Rust y Go con una precisión significativamente mejor que antes.
La reducción del 30% en los tokens de razonamiento aborda lo que los investigadores llaman “sobreanálisis”, un problema común en entornos de codificación automatizada. Cuando un modelo de IA utiliza demasiados tokens para razonar a través de un problema, consume recursos computacionales, aumenta la latencia y eleva los costos de la API para los desarrolladores.
De una startup de chatbot a una potencia de código abierto
Moonshot AI fue fundada en 2023 por Zhilin Yang, un egresado de la Universidad Tsinghua, quien construyó la empresa en torno a su chatbot Kimi. El giro hacia el lanzamiento de modelos de peso abierto comenzó con la serie K2 a mediados de 2025, y desde entonces el ritmo de iteración ha sido incesante.
El modelo base K2 se lanzó en julio de 2025. K2 Thinking siguió en noviembre de 2025, añadiendo capacidades de razonamiento mejoradas. K2.5 llegó en enero de 2026, y K2.6 llegó en abril de 2026. Ahora K2.7-Code llega en junio de 2026, convirtiéndose en la quinta versión principal en menos de un año.
La empresa ha estructurado sus modelos en torno a tres pilares: capacidades agentes, manejo de contexto extendido e entradas multimodales. K2.7-Code se enfoca fuertemente en los dos primeros, diseñado para escenarios donde un agente de IA necesita planificar, ejecutar y depurar código a través de secuencias largas.
