Випуск K2.6 Moonshot та підвищення цін сприймаються як підготовка до IPO

Стаття | Сян Сяньчжи

Позавчора ввечері Moonshot опублікувала Kimi K2.6 та змінила ціну введення API з 0,60 долара за мільйон токенів на 0,95 долара.

Зростання на 58%. Перше підвищення ціни з моменту запуску серії K2.

Але здається, ніхто не звертає уваги на це.

Чотири місяці тому, у внутрішньому листі в останній день 2025 року Ян Чжилінь написав, що «Місячна темрява» не поспішає з IPO. На той час проспекти Zhipu та MiniMax вже були подані до Гонконгської біржі — це була свідома позиційна відмінність.

Він також написав у цьому листі, що готівкові резерви компанії перевищують 1,4 млрд доларів США, а раунд C на 500 млн доларів США був перевищений — підтекст: потенціал первинного ринку ще не повністю реалізований, а вторинний ринок не поспішає.

Через три місяці Блумберг розповів, що він почав спілкуватися з CICC та Goldman Sachs. Ще через три тижні запустили K2.6.

Особа, яка не любить «спішити», за чотири місяці зробила те, що раніше казала, що не зробить.

K2.6 це точно не останній продукт, запущений до виходу Moonshot на біржу. Але цей випуск став першим презентаційним туром Яна Чжиліна після планованого виходу Moonshot на біржу.

Kimi ніколи раніше не випускав таку версію моделі

Kimi раніше мала певний набір дій при випуску моделей.

Публікуйте технічні звіти, відкривайте ваги, піднімайтеся в рейтингах HuggingFace, а потім чекайте на оцінку технічної спільноти. K1.5 порівнюється з o1 щодо методології міркувань, а технічні деталі перевищують кількість цифр у бенчмарках; K2 Thinking прямо завантажує ваги на HuggingFace, щоб розробники могли запускати тести самостійно. Ці дії адресовані розробникам і дослідникам.

Також використовується стандартна мова технічної спільноти: ми вирішили певну проблему, наш підхід кращий, ласкаво просимо повторити.

Дії K2.6 трохи інші.

Спочатку про підвищення цін. У китайських юанях ціна введення для K2.6 становить 6,5 юаня за мільйон токенів (невдача кешу), для K2.5 — 4 юані. Ціна виведення зросла з 21 до 27 юанів. Ціна при попаданні в кеш — 1,1 юаня.

Це структуроване підвищення цін. На перший погляд усі рівні зростають, але найменший приріст — у рівні збільшення кеш-попадань: з 0,7 юаня до 1,1 юаня, що становить 0,16 долара США за мільйон токенів.

Ці 0,16 долара — ключ до розуміння цього підвищення ціни.

Для корпоративних користувачів, які довгостроково використовують однаковий system prompt: кодовий асистент, фреймворк для оркестрування агентів, розумний служба підтримки — їх префікси сильно повторюються, частота співпадінь у кеші досягає 75–83%. Moonshot залишила цим клієнтам ціну майже на тому ж рівні.

Цим випадковим клієнтам, які користуються платформою рідко і кожного разу вводять інший запит, це підвищення цін повністю припало.

Це дружня корекція ціни для «бізнесів, вже прив’язаних до Kimi», і недружня корекція ціни для «окремих клієнтів, що ще порівнюють ціни». Перші — це «бізнес-клієнти з фіксованим контрактом» з історії запуску, а другі — «довгий хвіст» користувачів, яких не буде зображено на презентаціях для інвесторів. Місячна тінь добре розуміє, хто є його активом для оцінки.

Структура обчислювальних потужностей у епоху агентів відрізняється від епохи діалогів. Діалогові моделі передають десятки токенів, тоді як агенти виконують тисячі викликів інструментів і споживають десятки тисяч токенів. У офіційному прикладі K2.6 — локальне розгортання моделі Qwen3.5 на Mac з 4000 викликами інструментів протягом 12 годин, реконструкція відкритого движка обміну exchange-core з 1000 викликами інструментів протягом 13 годин, а ще більш екстремальний випадок — автономна робота протягом 5 днів для моніторингу та реагування на сповіщення та поломки — ці одноразові завдання споживають у сотні або навіть тисячі разів більше токенів, ніж сценарії діалогу епохи K2.5.

Звичайно, цей випадок використовується для пояснення здатності до довгострокових міркувань, але з урахуванням цієї кластерної мережі з 300 агентів K2.6, витрати токенів будуть дуже величезними.

За старою ціною 0,60 долара США виклик такого агентського завдання може призводити до збитків. За ціною 0,95 долара США витрати на висновування лише змогли б покрити.

Тож підвищення ціни — це не впевненість, а необхідність. Moonshot накопичила фінансування на 2,5 мільярда доларів США, з яких на C- та C+-раундах було 1,4 мільярда доларів США готівкою, але якщо наступне покоління K3 дійсно матиме розмір у 3–4 трильйони параметрів, то одна сесія передтренування може спожити половину з цих коштів.

Без підвищення цін, показники валової прибутковості за останні квартали до лістингу будуть поганими. У проспекті емісії мають розкриватися показники валової прибутковості.

Темна сторона Місяця

Цю справу можна було б відкрито обговорити — епоха Agent вимагає нової моделі ціноутворення. Але Moonshot цього не сказала. Бо користувачі C-боксу щойно вийшли з безкоштовної епохи K2 Thinking, і зараз говорити їм «я підняв ціни» — це не добра історія про продукт.

Це історія для іншої аудиторії — у Kimi вже є серія корпоративних клієнтів, які не можуть без неї обійтися, і вони готові платити більше. (Наприклад, я сам)

Друга річ — це порівняння з еталоном. Офіційно вибраними еталонами для K2.6 є GPT-5.4, Claude Opus 4.6 та Gemini 3.1 Pro. Усі вони є попередніми флагманськими моделями.

Того ж тижня Anthropic випустила Claude Mythos, а Opus 4.7 тільки-но запущена — обидва кращі на покоління від Opus 4.6. K2.6 не є їхнім аналогом.

Це насправді свідомий вибір. У порівнянні з Mythos, K2.6 знаходиться на позиції «підкорювача»; у порівнянні з Opus 4.6, K2.6 потрапляє до «першої ліги». Для цього потрібна оцінка в 18 мільярдів доларів США.

Кімі раніше такого не робила. Коли вийшов K2 Thinking, офіційна команда опублікувала повний набір бенчмарок — і з хорошими, і з поганими результатами, залишивши розуміння розробникам. Це — спосіб дій технічної спільноти: спільнота розуміє, де ти сильний, а де слабкий, і готова прийняти модель з явними недоліками, але чіткою стратегією.

Ролік PPT — ні. Для роліку PPT потрібен висновок, який менеджер інвестиційного фонду зрозуміє за 30 секунд: «на рівні або краще за найкращі закриті міжнародні моделі». Це пряме цитування з офіційного блогу K2.6.

Третє — кластер агентів та двійкова система з відкритим кодом. K2.6 оновив функцію Claw Groups — гетерогенне екосистемне середовище агентів, де агенти з різними пристроями, моделями та інструментальними ланцюжками працюють у спільному середовищі, а K2.6 виступає у ролі диспетчера. 300 підагентів працюють паралельно, 4000 кроків співпраці, 5 днів автономної роботи.

Ці цифри призначені для корпоративних клієнтів, а не для розробників. Для розробника фраза «300 агентів паралельно» не має практичного сенсу — він не запустить 300 агентів у локальному проекті. Ця конфігурація має сенс лише для одного типу клієнтів: великих підприємств, які використовують матрицю агентів для автоматизації повного циклу операцій.

Це історія Salesforce, а не HuggingFace.

Також K2.6 повністю відкритий. Ян Чжилінь сказав на форумі Чжунцзяньцзян 26 березня, що відкритість стане абсолютним перемогой.

Відкритий код + підприємницький кластер агентів — це позиція між DeepSeek та Anthropic, де обидва підходи займають по половині. Звучить як хороша історія. Але займати обидві позиції означає доводити справедливість обох.

Ринок капіталу насправді не цікавиться чи є відповіді на ці питання. Він вимагає лише того, щоб кожна лінія мала свою історію.

Зростання цін, порівняння та кластер агентів — ці три речі разом мають незвичайну спільну рису. Жодна з них не призначена для технічної спільноти.

Колишня основна логіка Kimi полягала в тому, що якщо розробники полюблять мене, корпоративні клієнти рано чи пізно долучаться, а капіталісти — ще раніше. Ця стратегія має назву «технічна щирість».

K2.6 Більше не чекаємо. Підвищення цін — це пряме оголошення про цінову владу бізнес-клієнтів, порівняння з GPT-5.4 — це раннє позиціонування оцінки, а кластери Agent та Claw Groups — це витреновані зразки для бізнес-послуг.

Кожне питання відповідає питанню на презентації для інвесторів: які ваші здібності до комерціалізації? Де ваше місце на ринку? Які ваші бар’єри для B2B?

Від Preview до GA стиснуто до 8 днів — та ж логіка. Попередні версії серії K2 проходили 2–3 місяців у режимі попереднього перегляду, щоб спільнота мала достатньо часу на тестування, зворотній зв’язок та ітерації. K2.6 не виділив собі такий простір. Це не означає, що технологія стала зрілішою швидше — просто терміни не чекають.

IPO у другій половині 2026 року; згідно з процедурою Гонконгської біржі, потрібно виділити 4–6 місяців на подання документів, запити, слухання, розповсюдження, визначення ціни та період охолодження. Запуск розповсюдження у вересні означає, що продукт має бути готовий до квітня.

У квітні не буде GA, після цього більше вікон не буде.

K3 — це справжній фінал

Але K2.6 — це не найсильніша карта, яку Місячна темна сторона може викласти.

У офіційному блозі є дуже стримане твердження: K2.6 — це «злітна смуга для K3».

12-годинне довготривале кодування, кластер з 300 агентів, компресор контексту — це не фінальна форма серії K2, а інфраструктура рівня виконання, яку може підтримувати більша базова модель. Moonshot не буде витрачати зусилля на запуск цього, якщо не буде впевнена, що більша модель зможе використовувати ці можливості.

Раніше в Reddit з’являлися інформації про K3 з цільовим розміром параметрів 3–4 трильйони. У порівнянні з трильйонним масштабом серії K2, це стрибок у базовій архітектурі.

Якщо K3 зможе випуститися під час вікна презентацій — це буде справжній відповідь. K2.6 прокладена смуга, K3 злітає.

Проблема в тому, чи встигнуть. Скільки часу потрібно для навчання моделі з 3–4 трильйонами параметрів? GPT-5 і Claude Opus 4.6 мають приблизно 6–9 місяців періоду попереднього навчання, після чого додаються ще кілька місяців на доналагодження та оцінку безпеки. Чи зможе Moonshot зі своїми поточними обчислювальними ресурсами — з урахуванням співпраці з Alibaba Cloud та поточних грошових резервів — скоротити цей цикл до 5–6 місяців?

Ця ставка зроблена на K2.6.

Від preview до GA за вісім днів, кластер агентів одразу розширено з 100 до 300, довгострокове виконання збільшено з кількох сотень кроків до 4000 — кожен крок скорочує час і створює простір для можливостей K3.

Якщо K3 вийде до серпня-вересня — це буде фінальний акорд на презентації.

Якщо не встигнеш — K3 стане «моделлю, яку можна буде запустити лише після лістингу», а K2.6 доведеться підтримувати самотньо.

Темна сторона Місяця робить ставку на те, що зможе.

Що є основою оцінки в 18 мільярдів доларів США?

Повернутися до оцінки.

Три місяці тому оцінка Moonshot становила 4,3 млрд доларів США, два місяці тому — 5,5 млрд доларів США, зараз — 18 млрд доларів США.

Не те, що темна сторона Місяця за ці три місяці посилилася в чотири рази. Після виходу на ринок ZhiPu та MiniMax ціни зросли в чотири рази, піднявши стелю всього сектору. Ринкова капіталізація ZhiPu на Гонконзькій біржі — 305 мільярдів гонконгських доларів, MiniMax — 309,2 мільярда гонконгських доларів — ринкова капіталізація обох компаній перевищила історичний максимум SenseTime.

Логіка ринкової капіталізації цих двох компаній не в тому, «що зможе зробити технологія наступного покоління», а в тому, «як сильно AI-активи можуть бути оцінені в цьому ринку Гонконгу».

Оцінка в 18 мільярдів доларів США для «Темного боку Місяця» базується на тій самій речі. Вона більше не доводить, що є найсильнішою китайською AI-компанією, а доводить, що є китайською AI-компанією, яку можна оцінити.

K2.6 Усі дії — підвищення ціни, позиціонування, кластер агентів, відкрите двоїсте схема — є відповіддю на цей тезис.

Але ще не доведено одне: чи готові кінцеві користувачі Kimi платити за підвищену ціну K2.6? Чи перейдуть платні підписники на DeepSeek або MiniMax? Скільки корпоративних клієнтів справді використовують Claw Groups, а скільки лише підписали POC?

Ці цифри — те, що інвестори обов’язково запитають під час презентації. K2.6 зараз може лише показати продукт. Чи зможе він перетворитися на цифри — залежить від наступних трьох місяців.

Коли ZhiPu вийшла на ринок, вона подала проспект із прибутком, ще не перейшовшим у позитивну зону, і MiniMax — те саме. Інвестори прийняли цю історію, бо тоді лише розпочався великий нарратив про «китайські AI-активи». Moonshot прийшла на шість місяців пізніше. Ту ж саму проблему ZhiPu та MiniMax можуть описати як «ми перевіряємо», а Moonshot — «ми монетизуємо».

Цей тиск повністю лежить у межах трьох місяців між K2.6 та K3.

Отже, повертаючись до початкового питання — чи є K2.6 останнім раундом презентацій перед запуском Moonlight?

Ні.

Якщо K3 встигне відповідати термінам роудшоу, тоді K3 — справжній фінал. K2.6 — лише підготовлена смуга для нього. Якщо K3 не встигне відповідати термінам роудшоу, тоді K2.6 повинен нести на собі всю історію лістингу. Це буде перша презентація, яку Ян Чжи лінь змушений буде розпочати раніше запланованого.

Жоден із результатів чотири місяці тому не був тим, чого хотів Ян Чжилінь.

Але все, що відбулося за ці чотири місяці — запуск Zhipu MiniMax, підняття потолка оцінки, стиснення вікна можливостей — змусило людину, яка не любить “поспіху”, поспішити.

К3 випускалися під час другої гри.