Зарубежные СМИ сообщают, что китайские производители передовых моделей в последнее время продолжают снижать цены на API: DeepSeek и Xiaomi объявили о новых тарифных планах, в то время как новые модели ведущих лабораторий США становятся дороже. Это еще больше расширяет разрыв в стоимости вывода между передовыми моделями Китая и США.
Для корпоративных клиентов стоимость модели в основном выражается в стоимости API, оплачиваемой за токены. После интеграции приложения с моделью расходы формируются за ввод, вывод и попадания в кэш, поэтому изменение цены за единицу напрямую влияет на коммерческую жизнеспособность AI-продукта.
DeepSeek и Xiaomi одновременно снижают цены
DeepSeek с 22 мая перевел скидку 75% на V4-Pro в постоянную цену. После корректировки цена за ввод составляет 0,435 доллара США за миллион токенов, а цена за вывод — 0,87 доллара США.
Xiaomi снизила цену на API MiMo-V2.5 26 мая: цена за ввод с кэшированием для версии Pro снизилась до 0,0036 доллара США за миллион токенов, а для некоторых проектов снижение достигло 99%. Согласно новой тарифной схеме Xiaomi, за ту же цену можно получить в 5–8 раз больше токенов.
Снижение цены обусловлено оптимизацией логики
Статья утверждает, что это снижение цен не является просто маркетинговым ходом. Ло Фули, руководитель команды MiMo Xiaomi и бывший ключевой разработчик DeepSeek, отметила, что основная экономия достигается за счет оптимизации кэширования и фреймворка для вывода. Система может повторно использовать больше уже обработанной информации, снижая повторные вычисления и тем самым уменьшая затраты на хранение и вывод.
Согласно их утверждению, соответствующие оптимизации значительно повысили производительность обработки кэшированных токенов, а общие затраты на хранение и обработку снизились примерно на 80%. При новых ценах API двигатель вывода в производственной среде остается примерно на уровне безубыточности даже при работе почти на полную мощность.
DeepSeek использует подход, основанный на сжатии архитектуры модели для снижения вычислительных затрат на контекст. В статье отмечается, что V4 применяет два типа чередующихся механизмов внимания, что значительно сокращает объем KV-кэша и снижает стоимость инференса одного токена в сценариях с длинным контекстом. При вычислении с контекстом в миллион токенов KV-кэш V4-Pro составляет всего около 10% от предыдущего поколения, а стоимость инференса одного токена — около 27% от предыдущего поколения.
Цена модели в США движется в противоположном направлении
Статья отмечает, что ведущие модели США в последнее время не последовали за снижением цен. GPT-5.5, выпущенный OpenAI в конце апреля, повысил цену за вывод до 30 долларов США за миллион токенов — примерно вдвое выше, чем у предыдущей версии. Цены на Claude Opus 4.7 от Anthropic остались неизменными, однако из-за обновления токенизатора один и тот же текст может генерировать больше токенов, в результате чего фактический счет может увеличиться до 35%.
Для сравнения, DeepSeek V4-Pro показал результат 80,6% на кодовом бенчмарке SWE-Verified, что близко к 80,8% у Claude Opus 4.6, но разница в цене вывода достигает десятков раз. После последнего пересмотра цен MiMo-V2.5-Pro от Xiaomi также достиг того же уровня цен на ввод и вывод, что и DeepSeek V4-Pro.
Статья также отмечает, что такие китайские производители моделей, как MiniMax, Moonshot AI и Z.AI, также поддерживают низкие цены. Согласно сравнению в статье, в втором квартале 2026 года разница в ценах между передовыми моделями Китая и США составит примерно от 15 до 30 раз; если учитывать скидки за кэширование, этот разрыв еще больше увеличится.
