Эта корректировка цен DeepSeek вызвала нелинейный резкий спад, принудительно введя отрасль в новую эпоху затрат.

Автор статьи, источник: 0x9999in1, ME News

Кратко

Цена пробила дно: в конце апреля 2026 года DeepSeek снизила цену вывода своей модели V4-Pro до 0,878 доллара США за миллион токенов за счет наложения временной скидки и снижения цен на кэширование, а цена ввода при попадании в кэш снизилась до 0,0037 доллара США (около 0,025 китайского юаня), полностью разрушив ценовой ориентир отрасли крупных моделей.
В Китае и США наблюдается «разрыв» в ценообразовании: по сравнению с ведущими мировыми производителями, совокупная стоимость вызова API DeepSeek-V4-Pro составляет примерно тридцатую часть от стоимости API OpenAI GPT-5.5 и Anthropic Claude Opus 4.7, что формирует чрезвычайно значительный ценовой разрыв.
Давление на внутренний конкурентный ландшафт: под давлением агрессивного ценообразования DeepSeek основные модели, такие как Zhipu GLM 5.1 и Moonshot Kimi K2.6, сталкиваются с огромным коммерческим давлением и могут быть вынуждены последовать примеру снижения цен, что значительно ускорит очищение отрасли.
«Попадание в кэш» становится ядром экономики: DeepSeek снизил цену попадания в кэш до 1/10 от первоначальной, что на фундаментальном уровне значительно выгодно для обработки длинных текстов, RAG (поиск, усиленный генерацией) и непрерывных многократных взаимодействий агентов.
Выводы исследовательского центра: базовые крупные модели ускоряют свою инфраструктуризацию, подобно электричеству и водоснабжению; будущая конкуренция полностью сместится с борьбы за размер параметров отдельных моделей на конкуренцию за оптимизацию затрат на вывод и долю рынка экосистемы разработчиков.

Введение: Точка невозврата стоимости вычислительных ресурсов для крупных моделей

Развитие технологий часто сопровождается экспоненциальным снижением стоимости — это неизбежный путь для любой революционной технологии на пути к всеобщему распространению. 25–26 апреля 2026 года индустрия ИИ пережила чрезвычайно значимый момент: ведущий производитель крупных моделей DeepSeek выпустил два «глубоководных бомбы». Сначала было объявлено о временном скидочном предложении в 2,5 раза для API модели DeepSeek-V4-Pro; вскоре после этого было объявлено, что цена за совпадение кэша ввода во всех API-сервисах была напрямую снижена до 1/10 от первоначальной цены.

После двух раундов накладывающихся стратегий корректировки цен до 5 мая 2026 года цена за входной кэш-хит на миллион токенов для DeepSeek-V4-Flash снизилась до удивительных 0,0029 доллара США (около 0,02 юаня), а цена за входной кэш-хит для DeepSeek-V4-Pro, соответствующего мировому уровню, составляет всего 0,0037 доллара США (около 0,025 юаня).

Ранее отрасль прогнозировала, что стоимость вывода крупных моделей будет снижаться примерно на 50% в год, но снижение цен DeepSeek вызвало нелинейный, резкий обвал, принудительно переведя отрасль в новую эпоху затрат. Мы считаем, что это далеко не простая маркетинговая акция или краткосрочная «цена война», а неизбежный результат оптимизации архитектуры алгоритмов на низком уровне (например, разреженные механизмы внимания, экстремальное развитие архитектуры MoE) и повышения инженерных возможностей вычислительных кластеров. В этом отчете на основе последних данных о ценах во всей отрасли мы глубоко проанализируем воздействие снижения цен DeepSeek на рынок и проведем горизонтальное сравнение коммерческой конкурентоспособности ведущих глобальных крупных моделей, чтобы предоставить руководству четкую дорожную карту эволюции отрасли.

Ключевое явление: Пробой пределов ценовой системы серии DeepSeek-V4

Чтобы понять масштаб этого снижения цен, нам необходимо глубоко проанализировать три ключевых измерения стоимости API крупных моделей: цена за ввод (без попадания в кэш), цена за ввод (с попаданием в кэш) и цена за вывод. Раньше система ценообразования обычно разделяла только ввод и вывод, но с развитием технологий длинного контекста (Long-Context) «коэффициент попадания в кэш (Cache Hit)» становится ключевым фактором, перестраивающим экономику API.

Разбор стратегии ценообразования: наложение скидок и кэширование плеча

Согласно последним опубликованным данным, DeepSeek применил трехкратную стратегию: снижение базовой цены + ограниченное по времени скидочное предложение + кэширование плеча.

Таблица 1: Сравнение новых и прежних цен API серии DeepSeek-V4 (в долларах США за миллион токенов)

Из таблицы 1 мы можем сделать несколько совершенно ясных наблюдений отрасли:

Во-первых, упрощение моделей Flash достигло дна. Для моделей Flash, ориентированных на высокую параллельность и низкую задержку, цена вывода остается на уровне 0,292 доллара США за миллион токенов — это уже крайняя граница, близкая к жесткой стоимости вычислительных ресурсов сервера. DeepSeek не стал дальше снижать базовую цену Flash, а изящно снизил цену «попадания в кэш» на 90%. Это означает, что при обработке большого количества повторяющихся системных подсказок (System Prompt) или фиксированных документов с вопросами и ответами стоимость модели Flash практически незаметна.

Во-вторых, снижение цен на модель Pro. Модель V4-Pro, являющаяся флагманской моделью, сопоставимой с ведущими мировыми моделями (такими как GPT-5), снизила цену за вывод с 3,511 доллара до 0,878 доллара. Еще более впечатляющим является то, что цена за ввод при попадании в кэш, которая ранее составляла 0,146 доллара, после применения временной скидки 2,5 раза и дополнительного снижения в 10 раз, теперь составляет всего 0,0037 доллара. Это крайне шокирующее число — стоимость вызова мирового顶尖ного интеллекта была сжата до уровня, при котором даже малые и средние предприятия, а также индивидуальные разработчики могут без ограничений осуществлять частые вызовы.

В-третьих, это вынуждает разработчиков оптимизировать инженерию Prompt. Установка цены при попадании в кэш на долю от цены при промахе (например, в модели Pro: 0,0037 доллара против 0,439 доллара, разница примерно в 118 раз) — это не только стратегия ценообразования, но и способ направить технологическую экосистему с помощью коммерческих механизмов. DeepSeek четко сообщает разработчикам: если ваша архитектура спроектирована правильно (например, фиксированный длинный контекст впереди, а изменяющийся короткий вопрос — позади), вы сможете получать входные вычислительные ресурсы практически бесплатно.

Поперечное сравнение: резкий контраст в ценообразовании глобальных и локальных крупных моделей

Сравнение только с собственным снижением цен DeepSeek недостаточно, чтобы увидеть полную картину; когда мы помещаем это в координатную систему глобального рынка крупных моделей 2026 года, эта стратегия ценообразования создает действительно пугающий контраст.

На основе данных OpenRouter и открытой информации от различных компаний, мы собрали последние данные о ценах на API девяти самых представительных крупных моделей внутри и за пределами Китая.

Таблица 2: Сравнение цен на API крупных моделей 2026 года по всему миру (в долларах США за миллион токенов)

Борьба с глобальными гигантами: разрушение мифа о «высоком интеллекте и высокой премии»

За последние два года в повествовании об ИИ OpenAI и Anthropic поддерживали согласованную позицию: самые умные модели должны получать наивысшую маржу прибыли. В настоящее время стоимость вывода GPT-5.5 и Claude Opus 4.7 составляет соответственно 30 и 25 долларов за миллион токенов. Эти два гиганта из Кремниевой долины пытаются сохранить свою высокую «налоговую ставку» на вычислительные ресурсы, монополизировав доступ к наиболее передовым возможностям вывода.

Однако появление DeepSeek-V4-Pro и его цена вывода в 0,878 доллара США прямо прорвала этот тонкий слой. Предположим, что V4-Pro в различных ключевых тестах (Benchmarks) и реальном использовании достигнет или приблизится к уровню GPT-5.5, тогда разница в цене вывода в 34 раза между этими двумя продуктами полностью разрушит логику премиум-ценообразования зарубежных гигантов на B2B-рынке.

По оценкам «ME News Intelligence», для компании, сильно зависящей от генерации контента с помощью ИИ, если ежемесячный объем вывода составляет 1 миллиард токенов, жесткие затраты на использование GPT-5.5 составят 30 000 долларов США; при переходе на DeepSeek-V4-Pro эти затраты резко снизятся до 878 долларов США. Такая разница в затратах на этом масштабе может повлиять на выживание стартапа. Это указывает на то, что китайские компании в области ИИ разработали совершенно отличный от硅谷 подход, сочетающий «эстетику силы» и «экстремальную инженерию» в области обучения базовых моделей и оптимизации инференс-кластеров.

Подавление отечественных конкурентов: ускорение масштабной перестройки отрасли

Если DeepSeek представляет собой снижение уровня конкуренции для зарубежных гигантов, то для отечественных конкурентов это жестокая игра с нулевой суммой.

Из таблицы 2 видно, что ведущие отечественные производители, такие как Zhipu (GLM 5.1, вывод 4,4 доллара) и Moonshot (Kimi K2.6, вывод 4 доллара), оказались в затруднительном положении с точки зрения ценообразования. Эти цены несколько месяцев назад считались «разумными и выгодными», но перед DeepSeek-V4-Pro (вывод 0,878 доллара) они мгновенно потеряли всю свою ценовую защиту. Даже Alibaba Cloud, всегда известная своей открытостью и низкими ценами (Qwen3.6 Plus, вывод 1,96 доллара), больше не кажется «дешевой».

На поле боя легких моделей Flash борьба также ожесточена. Step 3.5 Flash от Jiepao Xingchen имеет стоимость ввода всего 0,028 доллара США и вывода всего 0,299 доллара США, что очень близко к DeepSeek-V4-Flash (вывод 0,292 доллара США). Это показывает, что в сегменте легких моделей давление на стоимость вычислительных ресурсов достигло наноуровня, и все участники летят вплотную к границе себестоимости.

В целом, DeepSeek фактически использует возможности уровня Pro для конкуренции с ценами отечественных конкурентов на версиях Plus и даже стандартных; применяя цену уровня Flash для привлечения огромного объема низкоплотных долгих хвостовых потоков. Такая тактика «двустороннего зажима» значительно сжимает пространство для выживания других компаний, разрабатывающих крупные языковые модели, и после этой серии снижения цен гонка за выживание в сфере крупных моделей ИИ в Китае будет ускорена.

Глубокий анализ: технологическая и бизнес-логика за предельно низкими ценами

Низкая цена без фундаментальной поддержки неустойчива. DeepSeek осмеливается применить столь решительную стратегию снижения цен к 2026 году благодаря глубокой технической базе и крайне амбициозным коммерческим планам.

Техническая логика: от «сила кирпича — он летит» к «победа архитектуры»

Резкое падение цены по сути является высвобождением выгод от эволюции технической архитектуры.

Глубокая выгода архитектуры MoE (смешанные эксперты): в отличие от ранних крупных плотных моделей OpenAI, современные передовые модели в целом используют высокооптимизированную архитектуру MoE. DeepSeek очень вероятно еще больше снизил долю активируемых параметров в архитектуре V4. Это означает, что даже при большом общем количестве параметров во время каждого вывода активируются лишь крайне небольшие части «экспертов», что значительно снижает вычислительную нагрузку (FLOPs) и давление на пропускную способность видеопамяти при каждом вызове.
Революционный прорыв в управлении KV Cache: главной особенностью этой корректировки является снижение попаданий в кэш ввода до 1/10. В архитектуре Transformer основным узким местом при обработке длинных текстов является не вычисление, а占用 большого объема видеопамяти KV Cache для хранения контекстной информации. DeepSeek, очевидно, реализовал на системном уровне технологию пулинга KV Cache с общим доступом между запросами (например, усовершенствованную версию технологии RadixAttention). Когда множество одновременных запросов пользователей содержат одинаковые системные настройки или базу знаний, модель больше не нуждается в повторном вычислении этих токенов — она просто извлекает их из памяти или распределенного пула видеопамяти. Это позволяет сделать предельную стоимость "ввода длинных текстов" стремящейся к нулю.

Бизнес-логика: обмен прибыли на пространство, перестройка экосистемного защитного барьера

«ME News» считает, что временная скидка и стратегия минимальной цены DeepSeek имеют четкую и решительную коммерческую цель:

Сначала полностью уничтожьте экосистему «оболочечной тонкой настройки», чтобы вынудить взрывной рост нативных AI-приложений. Когда стоимость вызова самых мощных базовых моделей стремится к нулю, предпринимателям больше не будет иметь экономического смысла тратить огромные суммы на обучение или тонкую настройку собственных отраслевых малых моделей. DeepSeek с помощью низких цен пытается привлечь всех AI-разработчиков в свою экосистему API, превратив её в «основную инфраструктуру AI-эпохи», подобную Amazon AWS или Microsoft Azure.

Во-вторых, наступает рассвет взрыва агентов-позиционеров. Настоящие агентные приложения требуют от модели огромного количества самоанализа, рефлексии, планирования и многократных циклических вызовов (Loop). В этом процессе возникает огромное количество скрытого потребления токенов. Дорогие API — главный препятствие на пути распространения агентов. DeepSeek, снизив цену попадания в кэш до 0,0037 доллара, фактически обеспечивает экономическую жизнеспособность для «заставления ИИ пробежать десять тысяч кругов». Тот, кто предоставит самые низкие затраты на пробные ошибки, станет создателем величайших суперприложений, нативных для ИИ.

Влияние на отрасль и анализ тенденций: от «войны моделей» к «войне экосистем»

Для более наглядного демонстрирования влияния этих изменений цен на принятие корпоративных решений мы провели симуляцию затрат на корпоративное приложение.

Таблица 3: Симуляция затрат на корпоративное применение ИИ (предполагается обработка 100 миллионов входных токенов и 20 миллионов выходных токенов в месяц)

Из приведенной выше симуляции ясно видно, что ценовая политика DeepSeek — это не просто скидка, а перестройка модели затрат. Стоимость менее 30 долларов в месяц способна удовлетворить все потребности среднего предприятия в поддержке клиентов, анализе документов и проверке кода, что обязательно вызовет целую цепную реакцию:

Фундаментальный сдвиг в логике инвестиций в ИИ: капитал полностью утратит интерес к «созданию еще одной универсальной большой модели». За исключением крайне немногих государственных фондов или интернет-гигантов, дверь для универсальных базовых больших моделей надежно запаяна. Будущие инвестиции будут повсеместно направляться в прикладной уровень (Application Layer) и инфраструктурные промежуточные решения (инфраструктурные маршрутизаторы, AI-шлюзы и т.д.).
Маршрутизация по нескольким моделям (LLM Routing) становится стандартом: компании больше не будут привязываться к одной модели. Система автоматически распределяет задачи в зависимости от их сложности. Например, 90% повседневной очистки данных и простой классификации выполняются с крайне низкой стоимостью с помощью DeepSeek-V4-Flash или Step 3.5 Flash; 10% сложных логических рассуждений и генерации отчетов для руководства осуществляются с использованием DeepSeek-V4-Pro или по запросу — GPT-5.5.
Приложение для длинных текстов достигло настоящего коммерческого переломного момента: до этого «загрузка отчета в миллион слов для суммирования ИИ» звучало заманчиво, но стоимость API, составляющая несколько долларов за каждый запрос, отпугивала корпоративных клиентов. С падением цены за попадание в кэш ввода до уровня 0,02 юаня за миллион токенов, «чтение всей документации и интерактивное взаимодействие в реальном времени» станет стандартной функцией всех корпоративных программных решений для автоматизации офиса и ERP-систем.

Выводы и стратегические рекомендации

Волна снижения цен в апреле 2026 года ознаменовала официальный переход индустрии крупных моделей от классического романтизма «сравнения параметров и демонстрации результатов» к жестокой индустриальной эре «конкуренции за стоимость, захват вычислительных ресурсов и захват экосистемы». DeepSeek с помощью агрессивной ценовой стратегии не только продемонстрировал мировому сообществу глубокую экспертизу китайских компаний в области инженерии моделей ИИ, но и активно лопнул пузырь завышенной стоимости вычислительных ресурсов ИИ.

По этому поводу «ME News Think Tank» предлагает три рекомендации:

Для разработчиков приложений: откажитесь от страха перед стоимостью вызова крупных моделей. Немедленно прекратите создание и тонкую настройку базовых моделей с параметрами менее 10 миллиардов; перенаправьте все ресурсы разработки на улучшение пользовательского опыта, адаптацию на стороне клиента, создание барьеров на основе специализированных данных и отладку рабочих процессов агентов. Воспользуйтесь преимуществами этой волны «дешевых, мощных вычислительных ресурсов», чтобы быстро занять ниши.
Для CIO/CTO традиционных предприятий: переоцените стратегию AI-трансформации вашей компании. Проекты, ранее отложенные из-за соображений стоимости, такие как вопросы и ответы на базе базы знаний, автоматизированная служба поддержки и код-копилот, сейчас обладают крайне высокой рентабельностью инвестиций (ROI) при текущих ценах на API. Рекомендуется внедрить зрелую платформу LLMOps и создать корпоративный AI-шлюз для гибкого подключения наиболее выгодных на сегодня моделей.
Для конкурентов, ориентированных на базовые модели: необходимо отказаться от стратегии следования. Перед ценовой войной либо снижайте стоимость за счет еще более глубокой ко-оптимизации чипов и фреймворков, либо создавайте незаменимые технологические барьеры в дифференцированных областях, таких как встроенная интеллектуальность, нативная мультимодальность (генерация видео/3D) и сильные логические рассуждения в вертикальных отраслях. Плоская модель языковой модели больше не имеет будущего.

Крупные модели больше не являются божествами, сидящими в лабораториях — они с невиданной скоростью спускаются с пьедестала, превращаясь в мощный поток, движущий интеллектом всего сущего. И всё это только начинается.

Источник:

OpenRouter. (2026). База данных сравнения цен на API.
Официальное объявление DeepSeek. (2026, 25 апреля). Ограниченная по времени акция на API DeepSeek-V4-Pro.
Официальное объявление DeepSeek. (2026, 26 апреля). Демократизация вычислительных мощностей в эпоху крупных моделей: схема корректировки цен при попадании в глобальный кэш API.