DeepSeek потратила примерно 5,58 миллиона долларов на обучение своей модели V3. Для сравнения, американские конкуренты регулярно тратят десятки и сотни миллионов на модели передового уровня.
В мае 2026 года DeepSeek постоянно снизила цены на свою модель V4-Pro на 75%. Стоимость кэшированных входных данных снизилась до 0,025 юаня за миллион токенов.
DeepSeek не одинок в этой гонке к минимуму. Китайская компания 01.ai, по сообщениям, предлагает инференс примерно за 14 центов за миллион токенов, что делает китайские цены на API самыми низкими в мире.
Китайские ИИ-модели на OpenRouter показали рост объема в 5 раз, что обусловлено преимуществами в стоимости по сравнению с американскими аналогами.
Как они это делают
Китайские разработчики создали разреженные архитектуры MoE, сократившие активацию параметров с 671 миллиарда до всего 37 миллиардов. Это соответствует снижению вычислительных затрат на 90–97% на уровне вывода.
Помимо архитектуры, китайские команды внедрили методы обучения с пониженной точностью, такие как FP8, что снижает вычислительные требования к каждому отдельному вычислению.
Модель рассуждений DeepSeek R1 была обучена всего за 294 000 долларов с использованием 512 чипов H800 в течение 80 часов.
Рожденный из ограничений
С 2023 года экспортные ограничения США ограничили доступ китайских компаний к высокопроизводительным аппаратным решениям Nvidia. H100 и его последующие модели фактически недоступны. Китайские разработчики работают с H800 — пониженной версией чипа, разработанной для соблюдения экспортных правил.
Крупнейшие китайские игроки, охватывающие эту границу эффективности, включают Qwen от Alibaba, Kimi от Moonshot AI, GLM от Zhipu AI, Doubao от ByteDance, а также DeepSeek.
Что это значит для инвесторов
Если производительность ИИ передового уровня может быть достигнута при затратах на обучение менее 6 миллионов долларов, а не более 100 миллионов, защитный барьер капитальных затрат вокруг лидеров ИИ в США начинает выглядеть менее прочным.
Для крипто- и Web3-экосистемы более низкая стоимость вывода напрямую снижает расходы на запуск AI-ориентированных децентрализованных приложений, сетей оракулов и инструментов аналитики в цепочке.
Снижение вычислительных затрат на 97%, которого достигают китайские разработчики с помощью разреженных архитектур MoE, — это не просто технические достижения. Это сигналы цен, а рынки в конечном итоге следуют за сигналами цен.
