DeepSeek снижает стоимость API в 100 раз, вызывая дискуссию о централизации инфраструктуры ИИ

—— Начиная с выступления Gonka на LA Hacks 2026

26 апреля DeepSeek выпустил API серии V4 с новым ценообразованием: цена за попадание в кэш входных данных для всех моделей снижена до десятой части первоначальной цены; после применения ограниченной по времени скидки для версии Pro стоимость обработки миллиона токенов составляет всего 0,025 юаня — на порядок дешевле, чем год назад. Акции сектора вычислительных мощностей на рынке A-акций в тот же день закрылись на максимуме, настроения на рынке были восторженными.

Но за аплодисментами стоит вопрос, который никто не обсуждает напрямую: по мере того как модели становятся все дешевле, вычислительные ресурсы, необходимые для их запуска, становятся все более концентрированными.

Данные не лгут. В четвертом квартале 2025 года совокупные капитальные расходы четырех облачных провайдеров — Microsoft, Amazon, Meta и Google — выросли на 64% до 118,6 млрд долларов США; ожидается, что совокупные капитальные расходы за весь 2026 год увеличатся еще на 53% и достигнут 570,8 млрд долларов США. Google также повысил цель по объему поставок чипов TPU на 2026 год на 50% до 6 миллионов единиц. Сроки поставок серии чипов NVIDIA H100 в некоторых рынках уже достигают нескольких месяцев.

Право на ценообразование на уровне моделей смещается в сторону разработчиков, но контроль над вычислительными ресурсами концентрируется у немногих гигантов еще быстрее. Это скрытое, но глубокое противоречие эпохи ИИ.

Гонка

На этом фоне 24 апреля 2026 года сооснователи протокола Gonka Даниил и Дэвид Либерман вышли на сцену главного выступления LA Hacks 2026. Эта ежегодная крупнейшая университетская хакатон в UCLA в этом году проходила при участии братьев Либерман в качестве главных спикеров перед сотнями ведущих инженеров, готовых войти в эту отрасль. Их вопрос звучал особенно ясно в этот момент: еще не поздно ли для децентрализованных вычислительных ресурсов?

Одна сторона волны снижения цен

Логика снижения цен на DeepSeek V4, на поверхности, — это эффект повышения эффективности благодаря технологическому прогрессу: новый механизм внимания сжимает размерность токенов и в сочетании с разреженным вниманием DSA значительно снижает требования к вычислительным ресурсам и видеопамяти. Однако устойчивое снижение цен возможно только при условии, что где-то существует достаточное и достаточно дешевое вычислительное мощность.

Факт в том, что этот «достаточно обильный» источник вычислительной мощности по всему миру быстро концентрируется у немногих узлов. Руководитель компании-лидера в области оптоволоконной связи Lumentum, Майкл Харлстон недавно заявил, что, согласно текущим тенденциям, производственные мощности компании почти полностью распроданы до 2028 года. Это не проблема отдельной компании, а коллективное напряжение всей цепочки поставок инфраструктуры ИИ перед лицом стремительного роста спроса.

Даниил в своей речи на LA Hacks использовал простое, но мощное сравнение: вычислительная мощность сети Bitcoin превышает суммарную мощность трех облачных центров обработки данных Google, Microsoft и Amazon — но что именно делает эта мощность? Она решает хеш-головоломку, для которой никому не нужен ответ. То же самое и с глобальными избыточными GPU-вычислениями: видеокарты в игровых компьютерах, серверы в университетских лабораториях, резервные мощности у небольших и средних облачных провайдеров — в совокупности их объем огромен, но из-за отсутствия координационных механизмов они не могут быть использованы для AI-выводов.

Гонка пытается решить именно эту проблему координации — с помощью механизма стимулов доказательства работы объединить распределенные по всему миру простаивающие GPU в сеть, способную выполнять реальные задачи AI-вывода.

Два. Выводы — новое поле боя

Снижение цен DeepSeek вызвало широкие дискуссии в китайском интернете о «равенстве в области ИИ». Однако один важный нюанс упущен: снижаются не «стоимости вычислительных ресурсов», а «цены на вызов». По мере масштабирования применений ИИ рост объема вызовов вывода происходит по экспоненциальному закону — согласно прогнозам отрасли, к 2026 году вывод будет составлять около двух третей глобального потребления вычислительных ресурсов ИИ.

Что это означает? Каждое снижение цены на один порядок вызывает рост общей необходимой вычислительной мощности, а не ее уменьшение. «Демократизация» крупных моделей в некоторой степени ускоряет концентрацию вычислительных ресурсов — ведь только участники с огромными вычислительными мощностями могут поддерживать работу сервисов вывода при сверхнизкой марже.

Это формируется структурная блокировка: кто контролирует физические вычислительные мощности на стороне вывода, тот контролирует настоящий вход в инфраструктуру эпохи ИИ. С этой точки зрения значение децентрализованной вычислительной сети заключается не только в оптимизации затрат на 50%, а в предоставлении структурной альтернативы до завершения централизованной блокировки.

Три: Реальные вопросы к молодым строителям

Участники LA Hacks — инженеры и продукт-менеджеры из ведущих университетов Калифорнии — вскоре столкнутся с не слишком романтичным инженерным выбором: на каком уровне вычислительных мощностей построить свой продукт.

На чьих серверах работает ваш продукт ИИ для вывода расчетов?

Когда эта платформа изменяет стратегию ценообразования или политику доступа, есть ли у вас возможность миграции?

Вы создаете ценность для себя или пополняете запасы платформы, помогая ей расширять базу пользователей?

Эти проблемы уже переживались разработчиками в эпоху Web2: когда судьба приложения тесно связана с алгоритмами платформы или правилами распространения, «независимость» становится словом, которое нужно постоянно переопределять. Зависимость от вычислительных ресурсов в эпоху ИИ повторит ту же логику на уровне инфраструктуры, причем из-за более высоких затрат на переключение эффект привязки будет только сильнее.

Гонка

Хакатон как форма содержит в себе внутренний ироничный парадокс: за 36 часов создать работоспособный продукт с минимальными ресурсами и максимальной скоростью — именно это и является целью стимулирующих механизмов децентрализованных сетей. Даниил поднялся на сцену LA Hacks не просто чтобы рассказать о Gonka, а скорее чтобы задать этим людям вопрос: ваши будущие действия будут ускорять эту централизованную тенденцию или создавать новые возможности?

Четвертый: PoW 2.0: инженерная задача

Gonka перенастроила стимулирующую структуру доказательства работы с хеширования на AI-вывод, благодаря чему почти 100% вычислительной мощности сети напрямую соответствуют реальным задачам. Эта система требует ключевого инженерного условия: задачи AI-вывода должны быть проверяемыми и воспроизводимыми — при одинаковых весах модели, одинаковом случайном семени и входных данных любой узел может воспроизвести результат вычислений и проверить его корректность. Это основная инженерная сложность, которая позволила Gonka перейти от академического прототипа к работающей сети.

С экономической точки зрения, смысл этой системы заключается в том, что стоимость токена естественным образом привязана к физическим затратам на вычислительную мощность, а не к настроениям ликвидности. Майнеры, вносящие вычислительную мощность, получают вознаграждение, а разработчики, использующие эту мощность, оплачивают услуги — вся система мотивации замкнута и не зависит от доброй воли каких-либо посредников.

Конечно, техническая осуществимость — это лишь часть проблемы. Более сложный вопрос заключается в том, может ли распределённая вычислительная сеть, основанная на добровольных вкладах сообщества, составить реальную конкуренцию по масштабу в эпоху стремительного роста спроса на вычислительные мощности и капитальных затрат крупных игроков, измеряемых сотнями миллиардов долларов.

Ранние данные Gonka дают ориентир: за менее чем год после запуска главной сети агрегированная вычислительная мощность сети выросла с 60 эквивалентов H100 до более чем 10 000, и этот темп обусловлен спонтанным подключением сотен независимых узлов по всему миру, а не централизованным распределением. Это не доказывает, что проблема масштаба решена, но показывает, что стимулы эффективно стимулируют ранний рост.

Пять. Проблемы с окном времени

Исторически доминирование инфраструктуры часто быстро консолидировалось на ранних этапах — так было в эпоху железных дорог, в эпоху интернета и в эпоху мобильного интернета. Каждый раз кто-то находил возможность встроиться до того, как стандарты окончательно закрепились, а кто-то осознавал, что возможность участия резко сократилась, только после завершения централизации.

На каком этапе находится инфраструктура вычислительных мощностей ИИ? С учетом ожидаемых капитальных затрат четырех крупнейших облачных провайдеров в размере 570,8 млрд долларов США к 2026 году, централизация ускоряется; однако с точки зрения реальных моделей использования разработчиками, на стороне предложения все еще существует значительное количество неэффективно интегрированных ресурсов. Этот разрыв и представляет собой пространство, в котором может существовать децентрализованная сеть.

Даниил привел в своей речи аналогию: после краха интернет-пузыря в 2000 году осталась не руина, а оптоволоконные сети, проложенные по всему миру, которые обеспечили работу цифровой экономики в последующие два десятилетия. После спада инвестиционной истерии в инфраструктуру ИИ оставшиеся вычислительные протоколы и механизмы стимулирования станут инфраструктурой следующего цикла — вопрос лишь в том, какие протоколы имеют достаточно прочную основу, чтобы сохранять работоспособность под давлением.

Это не вопрос, касающийся какого-либо конкретного проекта, а проблема, с которой должна столкнуться вся децентрализованная ИИ-отрасль: может ли дизайн управления действительно противостоять эрозии одноточечного контроля? Будут ли стимулы оставаться эффективными после масштабирования? Является ли децентрализация вычислительной сети одновременно верной на трех уровнях: технической реализации, выпуска токенов и принятия решений о обновлениях?

Заключение

Снижение цен на DeepSeek снова подогрело нарратив о «демократизации ИИ». Но демократизация вызовов вывода и демократизация инфраструктуры вычислительных мощностей — это две разные вещи. Первая уже происходит; сможет ли произойти вторая, зависит от того, сколько людей в ближайшие годы действительно воспримут это как инженерную задачу, достойную решения, а не просто красивый нарратив.