Китайские ИИ-модели снижают затраты и превосходят американских конкурентов по эффективности обучения и вывода

DeepSeek потратила примерно 5,58 миллиона долларов на обучение своей модели V3. Для сравнения, американские конкуренты регулярно тратят десятки и сотни миллионов на модели передового уровня.

В мае 2026 года DeepSeek постоянно снизила цены на свою модель V4-Pro на 75%. Стоимость кэшированных входных данных снизилась до 0,025 юаня за миллион токенов.

DeepSeek не одинок в этой гонке к минимуму. Китайская компания 01.ai, по сообщениям, предлагает инференс примерно за 14 центов за миллион токенов, что делает китайские цены на API самыми низкими в мире.

Китайские ИИ-модели на OpenRouter показали рост объема в 5 раз, что обусловлено преимуществами в стоимости по сравнению с американскими аналогами.

Как они это делают

Китайские разработчики создали разреженные архитектуры MoE, сократившие активацию параметров с 671 миллиарда до всего 37 миллиардов. Это соответствует снижению вычислительных затрат на 90–97% на уровне вывода.

Помимо архитектуры, китайские команды внедрили методы обучения с пониженной точностью, такие как FP8, что снижает вычислительные требования к каждому отдельному вычислению.

Модель рассуждений DeepSeek R1 была обучена всего за 294 000 долларов с использованием 512 чипов H800 в течение 80 часов.

Рожденный из ограничений

С 2023 года экспортные ограничения США ограничили доступ китайских компаний к высокопроизводительным аппаратным решениям Nvidia. H100 и его последующие модели фактически недоступны. Китайские разработчики работают с H800 — пониженной версией чипа, разработанной для соблюдения экспортных правил.

Крупнейшие китайские игроки, охватывающие эту границу эффективности, включают Qwen от Alibaba, Kimi от Moonshot AI, GLM от Zhipu AI, Doubao от ByteDance, а также DeepSeek.

Что это значит для инвесторов

Если производительность ИИ передового уровня может быть достигнута при затратах на обучение менее 6 миллионов долларов, а не более 100 миллионов, защитный барьер капитальных затрат вокруг лидеров ИИ в США начинает выглядеть менее прочным.

Для крипто- и Web3-экосистемы более низкая стоимость вывода напрямую снижает расходы на запуск AI-ориентированных децентрализованных приложений, сетей оракулов и инструментов аналитики в цепочке.

Снижение вычислительных затрат на 97%, которого достигают китайские разработчики с помощью разреженных архитектур MoE, — это не просто технические достижения. Это сигналы цен, а рынки в конечном итоге следуют за сигналами цен.