Згідно з іноземними ЗМІ, китайські провідні виробники моделей недавно продовжують знижувати ціни на API: DeepSeek та Xiaomi оголосили про нові цінові схеми, тоді як нові моделі від провідних лабораторій США стають дорожчими. Це ще більше розширює розрив у вартості висновків між китайськими та американськими передовими моделями.
Для корпоративних клієнтів ціна моделі в основному відображається в витратах на API, що сплачуються за токени. Після інтеграції додатка з моделлю, вхідні дані, вихідні дані та спрацьовування кешу формують витрати, тому зміна ціни за одиницю безпосередньо впливає на комерційну доцільність AI-продукту.
DeepSeek та Xiaomi одночасно знижують ціни
DeepSeek 22 травня перетворив раніше 75%-ву знижку на V4-Pro на довгострокову ціну. Після коригування ціна за вхід становить 0,435 долара США за мільйон токенів, а за вихід — 0,87 долара США.
Xiaomi знизила ціни на API MiMo-V2.5 26 травня: ціна за вхід з потраплянням у кеш для версії Pro знизилася до 0,0036 долара за мільйон токенів, а деякі проекти зазнали зниження до 99%. За новими тарифними планами Xiaomi, за ту саму ціну можна отримати в 5–8 разів більше токенів.
За зниженням цін стоїть оптимізація висновків
У статті зазначається, що це зниження цін не є просто маркетинговим ходом. Ро Фулі, керівник команди MiMo Xiaomi та колишній ключовий розробник DeepSeek, зазначила, що основна економія досягається завдяки оптимізації кешу та інференс-фреймворку. Система може повторно використовувати більше вже обробленої інформації, зменшуючи повторні обчислення, що дозволяє знизити витрати на зберігання та інференс.
За їхніми словами, відповідні оптимізації значно підвищили продуктивність обробки кешованих токенів, знизивши загальні витрати на зберігання та обробку приблизно на 80%. За новими цінами на API, інженер виведення в продуктивному середовищі, навіть при майже повному навантаженні, все ще може досягти точки беззбитковості.
DeepSeek використовує стиснення архітектури моделі для зменшення витрат на обчислення контексту. У статті зазначається, що V4 застосовує два типи переплетених механізмів уваги, що значно зменшують розмір KV-кешу та витрати на інференс одного токена в сценаріях довгого контексту. При обчисленні контексту в мільйон токенів, KV-кеш V4-Pro становить лише приблизно 10% від попереднього покоління, а витрати на інференс одного токена — приблизно 27% від попереднього покоління.
Ціни американських моделей рухаються у протилежному напрямку
Стаття зазначає, що лідери США у сфері моделей не слідують за зниженням цін. OpenAI, яка випустила GPT-5.5 наприкінці квітня, підвищила ціну за вивід до 30 доларів США за мільйон токенів — майже вдвічі більше, ніж у попередньої версії. Ціна Claude Opus 4.7 від Anthropic залишилася незмінною, але через оновлення токенізатора той самий текст може генерувати більше токенів, що може збільшити фактичний рахунок до 35%.
Як порівняння, DeepSeek V4-Pro набрав 80,6% на кодовому бенчмарку SWE-Verified, що близько до 80,8% у Claude Opus 4.6, але різниця у цінах за вивід досягає десятків разів. Після останньої корекції цін MiMo-V2.5-Pro від Xiaomi також досяг того самого вхідного та вихідного цінового рівня, що й DeepSeek V4-Pro.
У статті також зазначається, що китайські виробники моделей, такі як MiniMax, Moonshot AI та Z.AI, також зберігають низькі ціни. За порівнянням у статті, у другому кварталі 2026 року різниця в цінах між передовими моделями Китаю та США становить приблизно від 15 до 30 разів; якщо врахувати знижки за кешування, розрив ще більше збільшиться.
