Китайські AI-моделі зменшують витрати й перевершують американських конкурентів за ефективністю навчання та виведення

DeepSeek навчав свою модель V3 приблизно за 5,58 мільйона доларів США. Для порівняння, американські конкуренти регулярно витрачають десятки до сотень мільйонів на моделі передового рівня.

У травні 2026 року DeepSeek на постійній основі знизила ціни на свою модель V4-Pro на 75%. Вартість кешованих вхідних даних знизилася до 0,025 юаня за мільйон токенів.

DeepSeek не є єдиним у цій гонці до дна. Китайська компанія 01.ai, за повідомленнями, пропонує виведення приблизно за 14 центів за мільйон токенів, що робить китайські ціни на API найнижчими у світі.

Китайські AI-моделі на OpenRouter досягли зростання обсягів у 5 разів, що зумовлено майже повністю їхніми перевагами у вартості порівняно з американськими альтернативами.

Як вони це роблять

Китайські розробники створили розріджені архітектури MoE, які зменшили активізацію параметрів з 671 мільярда до лише 37 мільярдів. Це означає зниження витрат на обчислення на 90–97% на рівні висновку.

Крім архітектури, китайські команди використовують методи навчання з меншою точністю, такі як FP8, що зменшує обчислювальні вимоги до кожного окремого обчислення.

Модель міркувань DeepSeek R1 була навчена лише за $294 000, використовуючи 512 чіпів H800 протягом 80 годин.

Народжений з обмежень

З 2023 року експортні обмеження США обмежили доступ китайських компаній до високопродуктивного обладнання Nvidia. H100 та його наступні моделі ефективно заборонені. Китайські розробники працюють з H800 — зниженою версією чіпу, розробленою для відповідності експортним правилам.

Основні китайські гравці, що охоплюють цю межу ефективності, — це Qwen від Alibaba, Kimi від Moonshot AI, GLM від Zhipu AI, Doubao від ByteDance, а також DeepSeek.

Що це означає для інвесторів

Якщо продуктивність штучного інтелекту передового рівня можлива при витратах на навчання менше $6 мільйонів, а не $100 мільйонів і більше, то капіталоємний рівень захисту лідерів США в галузі ШІ починає здаватися менш надійним.

Для крипто- та Web3-екосистеми дешевше виведення безпосередньо зменшує витрати на запуск AI-підтримуваних децентралізованих застосунків, мереж оракулів та інструментів аналітики ланцюга.

Зниження обчислювальних потужностей на 97%, якого досягають китайські розробники за допомогою розріджених архітектур MoE, — це не просто технічні досягнення. Це сигнали цін, а ринки в кінцевому підсумку слідують за сигналаціями цін.