Moonshot AI запускає Kimi-K2.7-Code з 1 трильйоном параметрів

Moonshot AI випустила Kimi-K2.7-Code — відкриту модель для програмування, яка має за мету зробити програмування з допомогою ШІ менш ресурсоємним і більш здатним. Компанія з Пекіна стверджує, що ця модель зменшує використання токенів міркувань на 30% порівняно з попередньою версією, що на практиці означає, що розробники витрачають менше обчислювальних ресурсів, отримуючи кращі результати.

Модель доступна на API платформи Kimi від Moonshot AI та розміщена на Hugging Face за модифікованою ліцензією MIT. Ця ліцензія дозволяє комерційне використання з вказівкою авторства для масштабних розгортань — це важлива деталь для будь-якої компанії, яка планує будувати продукти на її основі.

Числа, що стоять за оновленням

Kimi-K2.7-Code — це архітектура Mixture-of-Experts з загальною кількістю 1 трильйона параметрів і 32 мільярдами активних параметрів.

Покращення в порівнянні з попередньою моделлю K2.6 важко ігнорувати. Moonshot AI повідомляє про зростання на 21,8% у Kimi Code Bench v2, покращення на 11,0% у Program Bench та стрибок на 31,5% у MLS Bench Lite.

Останнє число особливо вражає. MLS Bench Lite тестує можливості підтримки багатьох мов, що означає, що модель виконує завдання між мовами програмування, такими як Python, Rust і Go, із значно кращою точністю, ніж раніше.

Зменшення на 30% кількості токенів міркувань вирішує те, що дослідники називають «перемірковуванням» — поширеною проблемою у автоматизованих середовищах програмування. Коли модель ШІ витрачає надто багато токенів на міркування щодо проблеми, це призводить до зайвого використання обчислювальних ресурсів, збільшення затримок і зростання витрат на API для розробників.

Від стартапу чат-бота до потужної відкритої платформи

Moonshot AI була заснована у 2023 році Чжиліном Яном, випускником Цинхуа, який створив компанію навколо чат-бота Kimi. Поворот до випуску моделей з відкритими вагами розпочався з серії K2 в середині 2025 року, і темпи ітерацій з тих пір були неймовірними.

Базова модель K2 була запущена в липні 2025 року. K2 Thinking з’явилася в листопаді 2025 року, додавши покращені можливості міркування. K2.5 з’явилася в січні 2026 року, а K2.6 — в квітні 2026 року. Тепер K2.7-Code з’являється в червні 2026 року, ставши п’ятою основною версією за менше ніж рік.

Компанія позиціонує свої моделі навколо трьох основних складових: агентні можливості, робота з розширеним контекстом та багатомодальні вхідні дані. K2.7-Code сильніше спирається на перші дві, розроблений для сценаріїв, де штучний інтелект повинен планувати, виконувати та виправляти код у довгих послідовностях.