DeepSeek зменшує витрати на API в 100 разів, що викликає дискусію щодо централізації інфраструктури ШІ

icon MarsBit
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Ончейн-новини від 26 квітня 2026 року показують, що DeepSeek зменшив витрати на API в 100 разів з запуском V4. Витрати на випадки попадання в кеш введення знизилися до десятої частини, а зі знижками мільйон токенів зараз коштують 0,025 юаня. Новини про штучний інтелект і криптовалюту підкреслюють вплив: інвестиційний сектор обчислювальних технологій Китаю стрімко зростає. Однак зростають занепокоєння щодо централизації інфраструктури ШІ, оскільки великі хмарні компанії збільшують капітальні витрати. Децентралізовані альтернативи, такі як протокол Gonka, тестують GPU-мережі, щоб заперечити цій тенденції.

—— Починаючи з виступу Gonka на LA Hacks 2026

26 квітня DeepSeek запустив V4 серію API нове ціноутворення: ціна за співпадіння кешу вхідних даних знижена до десятої частини початкової ціни, а після додавання обмеженого за часом знижки для Pro-версії вартість обробки мільйона токенів становить лише 0,025 юаня — у майже сто разів дешевше, ніж рік тому. Акції сектора обчислювальних потужностей на китайському ринку A в той же день закрилися на максимумі, ринкова емоція була на піку.

Але за аплодисментами є питання, якого ніхто не обговорює прямо: коли моделі стають все дешевшими, обчислювальні ресурси, необхідні для їх запуску, стають все більш концентрованими.

Дані не брешуть. У четвертому кварталі 2025 року капітальні витрати чотирьох хмарних провайдерів — Microsoft, Amazon, Meta та Google — зросли на 64% до 118,6 млрд доларів США; очікується, що загальні капітальні витрати за весь 2026 рік зростуть ще на 53% і досягнуть 570,8 млрд доларів США. Google також підвищив цільовий показник відправок чіпів TPU на 2026 рік на 50% до 6 мільйонів одиниць. Терміни поставок серії чіпів NVIDIA H100 в деяких ринках досягають кількох місяців.

Право визначення цін на рівні моделей зсувається на користь розробників, але контроль над рівнем обчислювальних потужностей швидше зосереджується в руках кількох гігантів. Це прихована, але глибока суперечність ери ШІ.

Гонка

На цьому тлі 24 квітня 2026 року співзасновники протоколу Gonka Даниїл та Девід Ліберман вийшли на головну сцену LA Hacks 2026. Ця щорічна найбільша університетська хакатон-подія UCLA в цьому році мала Ліберманів як головних промовців, звертаючись до сотень топових інженерів, які збираються вступити в цю галузь. Їхнє питання в цей момент звучало особливо чітко: чи ще не пізно для децентралізованої обчислювальної потужності?

Одна сторона хвилі зниження цін

Логіка зниження ціни DeepSeek V4 на поверхні полягає у ефективності, що виникає завдяки технічному прогресу — новий механізм уваги стискає вимір токенів і, поєднуючись із розрідженою увагою DSA, значно зменшує вимоги до обчислювальних ресурсів та відеопам’яті. Але тривале зниження ціни можливе лише за умови, що деякі обчислювальні ресурси достатньо доступні та дешеві.

Реальність така, що цей «достатньо достатній» джерело обчислювальної потужності по всьому світу швидко концентрується в небагатьох вузлах. Генеральний директор лідера у галузі оптичних комунікацій Lumentum Michael Hurlston недавно заявив, що відповідно до поточних тенденцій майже вся потужність компанії до 2028 року вже продана. Це не індивідуальна проблема окремої компанії, а загальна напруга в усьому ланцюжку постачання інфраструктури ШІ перед лицем швидкого зростання попиту.

Даніл у своїй промові на LA Hacks використав просте, але потужне порівняння: обчислювальна потужність мережі Bitcoin перевищує загальну потужність трьох хмарних центрів даних Google, Microsoft та Amazon — але що робить ця обчислювальна потужність? Вона розв’язує хеш-головоломку, відповідь на яку нікому не потрібна. Те саме стосується і глобальної вільної обчислювальної потужності GPU: відеокарти з комп’ютерів геймерів, сервери з університетських лабораторій, залишки потужностей у малих і середніх хмарних провайдерів — разом вони становлять величезний обсяг, але через відсутність координаційного механізму не можуть бути використані для AI-міркувань.

Gonka намагається вирішити саме цю проблему координації — за допомогою механізму стимулювання доведенням роботи об’єднати розсіяні по всьому світу простоючі GPU в мережу, здатну виконувати реальні завдання AI-виведення.

Друге: висновки — це нове поле битви

Зниження цін DeepSeek викликало широке обговорення «AI-рівності» у китайському інтернеті. Але було проігноровано один важливий нюанс: знижуються «ціни за виклик», а не «вартість обчислювальних ресурсів». Зі зростанням масштабування AI-застосунків, обсяги викликів для висновків зростають експоненційно — згідно з прогнозами галузі, до 2026 року висновки займатимуть приблизно дві третини глобального споживання AI-обчислювальних ресурсів.

Це що означає? Кожне зниження ціни за одиницю виклику призводить до збільшення, а не зменшення загальної кількості необхідних обчислювальних ресурсів. «Демократизація» великих моделей у певному сенсі прискорює концентрацію обчислювальних ресурсів — адже лише гравці з величезними обчислювальними потужностями можуть підтримувати роботу сервісів виведення при надзвичайно низькій маржі.

Це формується структурна блокування: хто контролює фізичні обчислювальні ресурси на стороні міркувань, той контролює справжній вхід до інфраструктури епохи ШІ. З цієї точки зору значення децентралізованої мережі обчислювальних ресурсів полягає не лише в оптимізації витрат на 50%, а в наданні структурної альтернативи до того, як буде завершено централізоване блокування.

Три: Істинні виклики для молодих розробників

Учасники LA Hacks — інженери та продукт-менеджери з найкращих університетів Каліфорнії — швидко стикнуться з неромантичним інженерним вибором: на якому рівні обчислювальних потужностей будувати свій продукт.

Які сервери використовуються для обробки вашого AI-продукту?

Чи маєте ви можливість міграції, коли та платформа змінює свою цінову стратегію або політику доступу?

Чи створюєте ви цінність для себе, допомагаючи побудувати користувацьку базу, чи просто надаєте платформі додаткові ресурси?

Ці питання вже пережили розробники в епоху Web2: коли доля додатка тісно пов’язана з алгоритмами платформи або правилами розповсюдження, «незалежність» стає словом, яке потрібно постійно переосмислювати. Залежність від обчислювальних ресурсів у епоху ШІ повторить ту саму логіку на рівні інфраструктури, а через вищу вартість переключення ефект блокування буде лише сильнішим.

Гонка

Хакатон, як форма, містить у собі внутрішній іронічний парадокс: за 36 годин створити працюючий продукт з мінімальними ресурсами та найшвидшим темпом — це саме той стан, якого прагнуть механізми стимулювання децентралізованих мереж. Даниіл вийшов на сцену LA Hacks не просто розповісти про Gonka, а більше запитав цю аудиторію: чи ваші майбутні дії сприятимуть прискоренню цієї централизованої тенденції, чи вони створюватимуть нові можливості?

Чотири: PoW 2.0 — інженерна задача

Gonka перенаправила стимулюючу структуру доведення роботи з хеш-обчислень на AI-висновки, що дозволяє майже 100% обчислювальних ресурсів мережі безпосередньо відповідати реальним завданням. Цей механізм має ключову інженерну вимогу: завдання AI-висновків повинні бути перевіряємими та відтворюваними — при наданні тих самих ваг моделі, тих самих випадкових насіння та вхідних даних будь-який вузол може відтворити результат обчислення та перевірити його дійсність. Це є основним інженерним викликом, який дозволив Gonka перейти від академічного прототипу до працюючої мережі.

З економічної точки зору, цей механізм має значення: вартість токена природно прив’язана до фізичних витрат на обчислювальну потужність, а не до настроїв ліквідності. Майни, які надають обчислювальну потужність, отримують винагороду, а розробники, які використовують обчислювальну потужність, сплачують плату — вся система стимулів замкнена і не залежить від доброго наміру будь-яких посередників.

Звичайно, технічна здійсненість — це лише частина проблеми. Більш складним питанням є: чи зможе розподілена мережа обчислювальних потужностей, що базується на добровільних внесках спільноти, досягти масштабу, щоб стати справжнім конкурентом у епоху стрімкого зростання вимог до обчислювальних потужностей і капітальних витрат великих гравців у розмірі сотень мільярдів доларів США?

Ранні дані Gonka дають відправну точку: за менше року після запуску головної мережі агрегована потужність мережі зросла з 60 еквівалентів H100 до понад 10 000, і цей темп був забезпечений за рахунок спонтанного підключення сотень незалежних вузлів по всьому світу, а не централізованого розподілу. Це не доводить, що проблема масштабу вирішена, але свідчить про те, що механізми стимулювання ефективно сприяють початковому зростанню.

П’ять. Проблеми з вікном часу

Історично домінування інфраструктури часто швидко конвергувало на початкових етапах — так було в епоху залізниць, в епоху Інтернету та в епоху мобільного Інтернету. Кожен раз хтось знаходив спосіб втиснутися до стандартів, ще не закріплених, а хтось усвідомлював, що можливості для участі значно звузилися, лише після того, як централізація була завершена.

На якому етапі зараз знаходиться інфраструктура обчислювальних потужностей ШІ? Згідно з очікуваними капіталовкладеннями чотирьох великих хмарних провайдерів у 2026 році у розмірі 570,8 млрд доларів США, централізація прискорюється; однак з точки зору реальних моделей використання розробниками, з боку пропозиції залишається велика кількість неефективно інтегрованих ресурсів. Цей розрив — це простір, який структурно може існувати для децентралізованих мереж.

Даніїл у своїй промові навів порівняння: після розколу інтернет-бульбашки 2000 року залишилися не руїни, а оптоволоконні мережі, розташовані по всьому світу, які забезпечували роботу цифрової економіки протягом наступних двадцяти років. Після відступу хвилі інвестицій у інфраструктуру ШІ, залишиться інфраструктура наступного циклу — протоколи обчислювальних потужностей та механізми стимулювання. Питання лише в тому, які протоколи мають достатньо міцну основну логіку, щоб залишатися працездатними під тиском.

Це не питання, пов’язане з конкретним проектом, а проблема, з якою повинен зіткнутися весь децентралізований AI-сектор: чи здатна система управління справді протистояти ерозії одноточкового контролю? Чи залишаються стимули ефективними після масштабування? Чи є децентралізація обчислювальної мережі справедливою одночасно на трьох рівнях: технічному виконанні, випуску токенів та прийнятті рішень щодо оновлень?

Закінчення

Зниження цін DeepSeek знову розжарює нарратив про «демократизацію ШІ». Але демократизація викликів висновку й демократизація інфраструктури обчислювальних потужностей — це дві різні речі. Перше вже відбувається; чи відбудеться друге, залежить від того, скільки людей наступних кількох років справді сприймуть це як інженерну проблему, гідну вирішення, а не просто приємний нарратив.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.