DeepSeek навчав свою модель V3 приблизно за 5,58 мільйона доларів США. Для порівняння, американські конкуренти регулярно витрачають десятки до сотень мільйонів на моделі передового рівня.
У травні 2026 року DeepSeek на постійній основі знизила ціни на свою модель V4-Pro на 75%. Вартість кешованих вхідних даних знизилася до 0,025 юаня за мільйон токенів.
DeepSeek не є єдиним у цій гонці до дна. Китайська компанія 01.ai, за повідомленнями, пропонує виведення приблизно за 14 центів за мільйон токенів, що робить китайські ціни на API найнижчими у світі.
Китайські AI-моделі на OpenRouter досягли зростання обсягів у 5 разів, що зумовлено майже повністю їхніми перевагами у вартості порівняно з американськими альтернативами.
Як вони це роблять
Китайські розробники створили розріджені архітектури MoE, які зменшили активізацію параметрів з 671 мільярда до лише 37 мільярдів. Це означає зниження витрат на обчислення на 90–97% на рівні висновку.
Крім архітектури, китайські команди використовують методи навчання з меншою точністю, такі як FP8, що зменшує обчислювальні вимоги до кожного окремого обчислення.
Модель міркувань DeepSeek R1 була навчена лише за $294 000, використовуючи 512 чіпів H800 протягом 80 годин.
Народжений з обмежень
З 2023 року експортні обмеження США обмежили доступ китайських компаній до високопродуктивного обладнання Nvidia. H100 та його наступні моделі ефективно заборонені. Китайські розробники працюють з H800 — зниженою версією чіпу, розробленою для відповідності експортним правилам.
Основні китайські гравці, що охоплюють цю межу ефективності, — це Qwen від Alibaba, Kimi від Moonshot AI, GLM від Zhipu AI, Doubao від ByteDance, а також DeepSeek.
Що це означає для інвесторів
Якщо продуктивність штучного інтелекту передового рівня можлива при витратах на навчання менше $6 мільйонів, а не $100 мільйонів і більше, то капіталоємний рівень захисту лідерів США в галузі ШІ починає здаватися менш надійним.
Для крипто- та Web3-екосистеми дешевше виведення безпосередньо зменшує витрати на запуск AI-підтримуваних децентралізованих застосунків, мереж оракулів та інструментів аналітики ланцюга.
Зниження обчислювальних потужностей на 97%, якого досягають китайські розробники за допомогою розріджених архітектур MoE, — це не просто технічні досягнення. Це сигнали цін, а ринки в кінцевому підсумку слідують за сигналаціями цін.
