DeepSeek снижает стоимость API в 100 раз, вызывая дискуссию о централизации инфраструктуры ИИ

icon MarsBit
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Новости в цепочке от 26 апреля 2026 года показывают, что DeepSeek сократил стоимость API в 100 раз с запуском V4. Стоимость сборов за попадание в кэш ввода снизилась до одной десятой, а с учетом скидок один миллион токенов теперь стоит 0,025 юаня. Новости об ИИ и криптовалюте подчеркивают влияние: рынок вычислительных ресурсов Китая в A-акциях резко вырос. Однако растут опасения по поводу централизации инфраструктуры ИИ, поскольку крупные облачные компании увеличивают капитальные расходы. Децентрализованные альтернативы, такие как протокол Gonka, тестируют сети GPU для противодействия этой тенденции.

—— Начиная с выступления Gonka на LA Hacks 2026

26 апреля DeepSeek выпустил API серии V4 с новым ценообразованием: цена за попадание в кэш входных данных для всех моделей снижена до десятой части первоначальной цены; после применения ограниченной по времени скидки для версии Pro стоимость обработки миллиона токенов составляет всего 0,025 юаня — на порядок дешевле, чем год назад. Акции сектора вычислительных мощностей на рынке A-акций в тот же день закрылись на максимуме, настроения на рынке были восторженными.

Но за аплодисментами стоит вопрос, который никто не обсуждает напрямую: по мере того как модели становятся все дешевле, вычислительные ресурсы, необходимые для их запуска, становятся все более концентрированными.

Данные не лгут. В четвертом квартале 2025 года совокупные капитальные расходы четырех облачных провайдеров — Microsoft, Amazon, Meta и Google — выросли на 64% до 118,6 млрд долларов США; ожидается, что совокупные капитальные расходы за весь 2026 год увеличатся еще на 53% и достигнут 570,8 млрд долларов США. Google также повысил цель по объему поставок чипов TPU на 2026 год на 50% до 6 миллионов единиц. Сроки поставок серии чипов NVIDIA H100 в некоторых рынках уже достигают нескольких месяцев.

Право на ценообразование на уровне моделей смещается в сторону разработчиков, но контроль над вычислительными ресурсами концентрируется у немногих гигантов еще быстрее. Это скрытое, но глубокое противоречие эпохи ИИ.

Гонка

На этом фоне 24 апреля 2026 года сооснователи протокола Gonka Даниил и Дэвид Либерман вышли на сцену главного выступления LA Hacks 2026. Эта ежегодная крупнейшая университетская хакатон в UCLA в этом году проходила при участии братьев Либерман в качестве главных спикеров перед сотнями ведущих инженеров, готовых войти в эту отрасль. Их вопрос звучал особенно ясно в этот момент: еще не поздно ли для децентрализованных вычислительных ресурсов?

Одна сторона волны снижения цен

Логика снижения цен на DeepSeek V4, на поверхности, — это эффект повышения эффективности благодаря технологическому прогрессу: новый механизм внимания сжимает размерность токенов и в сочетании с разреженным вниманием DSA значительно снижает требования к вычислительным ресурсам и видеопамяти. Однако устойчивое снижение цен возможно только при условии, что где-то существует достаточное и достаточно дешевое вычислительное мощность.

Факт в том, что этот «достаточно обильный» источник вычислительной мощности по всему миру быстро концентрируется у немногих узлов. Руководитель компании-лидера в области оптоволоконной связи Lumentum, Майкл Харлстон недавно заявил, что, согласно текущим тенденциям, производственные мощности компании почти полностью распроданы до 2028 года. Это не проблема отдельной компании, а коллективное напряжение всей цепочки поставок инфраструктуры ИИ перед лицом стремительного роста спроса.

Даниил в своей речи на LA Hacks использовал простое, но мощное сравнение: вычислительная мощность сети Bitcoin превышает суммарную мощность трех облачных центров обработки данных Google, Microsoft и Amazon — но что именно делает эта мощность? Она решает хеш-головоломку, для которой никому не нужен ответ. То же самое и с глобальными избыточными GPU-вычислениями: видеокарты в игровых компьютерах, серверы в университетских лабораториях, резервные мощности у небольших и средних облачных провайдеров — в совокупности их объем огромен, но из-за отсутствия координационных механизмов они не могут быть использованы для AI-выводов.

Гонка пытается решить именно эту проблему координации — с помощью механизма стимулов доказательства работы объединить распределенные по всему миру простаивающие GPU в сеть, способную выполнять реальные задачи AI-вывода.

Два. Выводы — новое поле боя

Снижение цен DeepSeek вызвало широкие дискуссии в китайском интернете о «равенстве в области ИИ». Однако один важный нюанс упущен: снижаются не «стоимости вычислительных ресурсов», а «цены на вызов». По мере масштабирования применений ИИ рост объема вызовов вывода происходит по экспоненциальному закону — согласно прогнозам отрасли, к 2026 году вывод будет составлять около двух третей глобального потребления вычислительных ресурсов ИИ.

Что это означает? Каждое снижение цены на один порядок вызывает рост общей необходимой вычислительной мощности, а не ее уменьшение. «Демократизация» крупных моделей в некоторой степени ускоряет концентрацию вычислительных ресурсов — ведь только участники с огромными вычислительными мощностями могут поддерживать работу сервисов вывода при сверхнизкой марже.

Это формируется структурная блокировка: кто контролирует физические вычислительные мощности на стороне вывода, тот контролирует настоящий вход в инфраструктуру эпохи ИИ. С этой точки зрения значение децентрализованной вычислительной сети заключается не только в оптимизации затрат на 50%, а в предоставлении структурной альтернативы до завершения централизованной блокировки.

Три: Реальные вопросы к молодым строителям

Участники LA Hacks — инженеры и продукт-менеджеры из ведущих университетов Калифорнии — вскоре столкнутся с не слишком романтичным инженерным выбором: на каком уровне вычислительных мощностей построить свой продукт.

На чьих серверах работает ваш продукт ИИ для вывода расчетов?

Когда эта платформа изменяет стратегию ценообразования или политику доступа, есть ли у вас возможность миграции?

Вы создаете ценность для себя или пополняете запасы платформы, помогая ей расширять базу пользователей?

Эти проблемы уже переживались разработчиками в эпоху Web2: когда судьба приложения тесно связана с алгоритмами платформы или правилами распространения, «независимость» становится словом, которое нужно постоянно переопределять. Зависимость от вычислительных ресурсов в эпоху ИИ повторит ту же логику на уровне инфраструктуры, причем из-за более высоких затрат на переключение эффект привязки будет только сильнее.

Гонка

Хакатон как форма содержит в себе внутренний ироничный парадокс: за 36 часов создать работоспособный продукт с минимальными ресурсами и максимальной скоростью — именно это и является целью стимулирующих механизмов децентрализованных сетей. Даниил поднялся на сцену LA Hacks не просто чтобы рассказать о Gonka, а скорее чтобы задать этим людям вопрос: ваши будущие действия будут ускорять эту централизованную тенденцию или создавать новые возможности?

Четвертый: PoW 2.0: инженерная задача

Gonka перенастроила стимулирующую структуру доказательства работы с хеширования на AI-вывод, благодаря чему почти 100% вычислительной мощности сети напрямую соответствуют реальным задачам. Эта система требует ключевого инженерного условия: задачи AI-вывода должны быть проверяемыми и воспроизводимыми — при одинаковых весах модели, одинаковом случайном семени и входных данных любой узел может воспроизвести результат вычислений и проверить его корректность. Это основная инженерная сложность, которая позволила Gonka перейти от академического прототипа к работающей сети.

С экономической точки зрения, смысл этой системы заключается в том, что стоимость токена естественным образом привязана к физическим затратам на вычислительную мощность, а не к настроениям ликвидности. Майнеры, вносящие вычислительную мощность, получают вознаграждение, а разработчики, использующие эту мощность, оплачивают услуги — вся система мотивации замкнута и не зависит от доброй воли каких-либо посредников.

Конечно, техническая осуществимость — это лишь часть проблемы. Более сложный вопрос заключается в том, может ли распределённая вычислительная сеть, основанная на добровольных вкладах сообщества, составить реальную конкуренцию по масштабу в эпоху стремительного роста спроса на вычислительные мощности и капитальных затрат крупных игроков, измеряемых сотнями миллиардов долларов.

Ранние данные Gonka дают ориентир: за менее чем год после запуска главной сети агрегированная вычислительная мощность сети выросла с 60 эквивалентов H100 до более чем 10 000, и этот темп обусловлен спонтанным подключением сотен независимых узлов по всему миру, а не централизованным распределением. Это не доказывает, что проблема масштаба решена, но показывает, что стимулы эффективно стимулируют ранний рост.

Пять. Проблемы с окном времени

Исторически доминирование инфраструктуры часто быстро консолидировалось на ранних этапах — так было в эпоху железных дорог, в эпоху интернета и в эпоху мобильного интернета. Каждый раз кто-то находил возможность встроиться до того, как стандарты окончательно закрепились, а кто-то осознавал, что возможность участия резко сократилась, только после завершения централизации.

На каком этапе находится инфраструктура вычислительных мощностей ИИ? С учетом ожидаемых капитальных затрат четырех крупнейших облачных провайдеров в размере 570,8 млрд долларов США к 2026 году, централизация ускоряется; однако с точки зрения реальных моделей использования разработчиками, на стороне предложения все еще существует значительное количество неэффективно интегрированных ресурсов. Этот разрыв и представляет собой пространство, в котором может существовать децентрализованная сеть.

Даниил привел в своей речи аналогию: после краха интернет-пузыря в 2000 году осталась не руина, а оптоволоконные сети, проложенные по всему миру, которые обеспечили работу цифровой экономики в последующие два десятилетия. После спада инвестиционной истерии в инфраструктуру ИИ оставшиеся вычислительные протоколы и механизмы стимулирования станут инфраструктурой следующего цикла — вопрос лишь в том, какие протоколы имеют достаточно прочную основу, чтобы сохранять работоспособность под давлением.

Это не вопрос, касающийся какого-либо конкретного проекта, а проблема, с которой должна столкнуться вся децентрализованная ИИ-отрасль: может ли дизайн управления действительно противостоять эрозии одноточечного контроля? Будут ли стимулы оставаться эффективными после масштабирования? Является ли децентрализация вычислительной сети одновременно верной на трех уровнях: технической реализации, выпуска токенов и принятия решений о обновлениях?

Заключение

Снижение цен на DeepSeek снова подогрело нарратив о «демократизации ИИ». Но демократизация вызовов вывода и демократизация инфраструктуры вычислительных мощностей — это две разные вещи. Первая уже происходит; сможет ли произойти вторая, зависит от того, сколько людей в ближайшие годы действительно воспримут это как инженерную задачу, достойную решения, а не просто красивый нарратив.

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.