Китайське ШІ відстає від США у доступі до високопродуктивних чипів для навчання та обчислювальній потужності

Обмеження обчислювальної потужності

З кінця минулого року компанії, такі як Moortec, Muxi Semiconductor, Biren Technology та TianShu Intelligent Chip, що виробляють китайські GPU, викликали хвилю інвестицій. Однак під час цього багатственого заходу на вторинному ринку одна неодмінно важлива тенденція стає все більш очевидною, а проблеми, які вона викликає, — все більш терміновими.

Протягом останніх кількох років китайські AI-чіпи зосереджувалися на відносно безпечних та менш важливих «висновкових» завданнях, наприклад, недавно проект DouBao планує закупити 50 000 чіпів TianShu ZhiXin для виконання завдань висновування, щоб задовольнити високочастотні запити цього найбільшого китайського AI-додатка.

У той час як у верхній частині піраміди обчислювальних потужностей для навчання ШІ, вітчизняні чіпи наразі можуть брати участь лише у периферійних «допоміжних» завданнях.

Чіпи для навчання ШІ використовуються переважно для навчання моделей штучного інтелекту, під час якого виконуються величезний обсяг матричних обчислень та налаштування параметрів, тому вони повинні мати потужну обчислювальну здатність та високу енергоефективність; вони є більш потужними та значно дорожчими, наприклад, NVIDIA A100, H100, H200 та серія AMD MI300;

З іншого боку, завдання для інференс-чіпів значно простіші. Вони використовуються на етапі розгортання після навчання моделі та відповідають за виконання інференс-завдань моделі. До них висунуті вимоги щодо високої часової чутливості: інференс-чіпи повинні забезпечувати швидку відповідь та низьке споживання енергії, зберігаючи при цьому високу точність.

Відповідним порівнянням буде те, що навчання — це процес, за допомогою якого AI-модель «засвоює знання», а висновок — це процес, за допомогою якого велика модель «застосовує знання». На етапі навчання чіпи для навчання мають використовувати величезний обсяг даних для «підживлення» динамічного оновлення параметрів у розмірі мільярдів, трильйонів і навіть десятків трильйонів, що вимагає не лише потужної обчислювальної здатності, але й ефективної пропускної здатності та здатності до зв’язку, а також забезпечення стабільності в кластерах з тисячами чіпів.

Основна причина розриву між китайськими та американськими моделями полягає саме в цих «невидимих» аспектах, зокрема в відсутності високопродуктивних тренувальних чіпів.

За законом масштабування великих моделей, чим більше параметрів моделі, тим більше лінійно зростає потреба у обчислювальних ресурсах, а експоненційне збільшення витрат на обчислювальну потужність та обладнання робить навчання великих моделей «ексклюзивною грою» лише для кількох технологічних гігантів.

Серед американських технологічних гігантів лише Meta планує розгорнути понад 1,2 мільйона високопродуктивних GPU до кінця 2026 року, щорічно інвестуючи понад 145 мільярдів доларів США; за оцінками, загальна потужність AI, якою володіє Google, еквівалентна 5 мільйонам чипів NVIDIA H100 — це одна четверта частина світового обсягу.

Чотири компанії — Amazon, Microsoft, Alphabet та Meta — у цьому році вклали 725 мільярдів доларів США у капітальні витрати, що на 77% більше, ніж у попередньому році; цей рівень становить 13% від загальних приватних капітальних витрат у США за рік. Morgan Stanley передбачає, що до 2027 року капітальні витрати американських технологічних компаній можуть досягти історичного рекорду в 1,1 трильйона доларів США.

Зараз США контролюють понад 70% світового ринку високопродуктивних GPU, і після заборони на чіпси доступні високопродуктивні чіпси в країні становлять лише 1/8 від американських. У звіті Stanford AI Index Report 2026 зазначено, що кількість центрів обробки даних у США (5427) більша за китайську понад у 10 разів.

За оцінками Китайського інституту інформаційно-комунікаційних технологій (CAICT), станом на початок 2025 року потужність обчислень у США становить 2400 EFLOPS, у Китаї — 1053 EFLOPS, що більше ніж у два рази.

Величина обчислювальних потужностей, якими володіють чотири вищезазначені технологічні гіганти, кожна окремо перевищує сумарну потужність усіх китайських компаній у сфері ШІ.

Цей переважаючий перевага в обчислювальній потужності дозволяє американським компаніям проводити десятки ітерацій експериментів з великою моделлю протягом року.

Маск йде ще далі: його xAI володіє Colossus 2 — першим у світі AI-кластером потужністю GW. Тому він може сміливо стверджувати, що одночасно навчає 7 моделей: дві з 1 трильйоном параметрів, дві з 1,5 трильйоном, одна з 6 трильйонами та одна з 10 трильйонами параметрів. Така «військова краса» можлива лише за умови надзвичайної надлишковості обчислювальних ресурсів.

Тим часом, через обмеження США на експорт чіпів, частка китайських компаній у поставках високопродуктивних AI-чіпів за останні роки постійно знижується (за даними epoch.AI).

Можна сказати без перебільшення, що велика різниця в обчислювальній потужності призведе до того, що китайське ШІ залишиться на тривалий час у стадії відставання, а також ускладнить процес наздогнання китайськими великими моделями їхніх американських колег.

Різниця поколінь

Кроки Китаю в інноваціях неможливо зупинити, «хто думає, що Китай не зможе зробити (чіпи), той справді помиляється. Розрив між Китаєм і США становить лише наносекунди».

Засновник NVIDIA Хуан Ренсюнь неодноразово відзначав прогрес китайської напівпровідникової галузі на публічних заходах.

Маск також часто висловлює подібні думки в X: «Китай обов’язково вирішить проблему з чіпами, у сфері обчислювальних потужностей штучного інтелекту він обов’язково перевершить всі інші країни світу», «Китай виграє гонку штучного інтелекту на Землі».

Великі імена зі світу технологій надають надзвичайно позитивні оцінки розвитку штучного інтелекту в Китаї, що легко може ввести людей в оману. Ці висловлювання явно мають ознаки «занадтої хвалебності». Деякі американські ЗМІ постійно поширюють ідею про те, що розрив між китайськими та американськими моделями мінімальний, намагаючись спотворити факти та приховати деякі об’єктивні істини.

У цьому контексті всі внутрішні галузі, пов’язані з ШІ, повинні зберігати ясність і спокій.

Якщо сьогодні китайські передові великі моделі при вирішенні стандартизованих завдань не сильно відрізняються від американських аналогів, то в складних промислових та корпоративних середовищах розрив стає набагато помітнішим.

У порівнянні з передовими моделями компаній США, таких як Anthropic, Китай все ще є прогоняючим. Оцінка CAISI США вказує, що найпотужніша китайська модель DeepSeek V4 Pro відстає від передових американських приблизно на 8 місяців.

Лі Кайфу недавно зазначив у інтерв’ю з The Wall Street Journal, що США зараз лідирують над Китаєм приблизно на 15 місяців, з урахуванням таких передових моделей, як Claude Fable 5, розроблених Anthropic.

Великі моделі дотримуються закону масштабування: чим більше параметрів моделі, чим більше даних для навчання та чим більше обчислювальних ресурсів вкладено, тим краще продуктивність моделі. Зараз найсучасніші великі моделі США вступили в еру десятків трильйонів параметрів, і швидкість їхньої ітерації продовжує збільшуватися.

Найпотужніша модель Anthropic Mythos досягла 10 трильйонів параметрів, її навчання вимагає 10 мільярдів доларів; xAI одночасно навчає 7 моделей, включаючи моделі з 6 і 10 трильйонами параметрів; OpenAI робить ітерацію моделі з 4 трильйонами параметрів за один місяць.

Найпотужніша китайська модель DeepSeek V4 Pro має загальну кількість параметрів 1,6 трильйона, що приблизно у 6 разів менше, ніж у передових американських моделей розміром у десятки трильйонів.

Серія Claude від Anthropic вже визнана найпотужнішою AI-моделлю для програмування за останні два роки, а Mythos знову переписала уявлення громадськості — її продуктивність навіть вища, ніж у попереднього флагмана Oups 4.6.

OpenBSD має репутацію найбезпечнішої системи у галузі, але Mythos знайшов уразливість, яку не виявляли протягом 27 років, а також виявив уразливості у FFmpeg та ядрі Linux, які залишалися непоміченими протягом кількох або навіть десятків років, причому все це було зроблено автономно, без участі людини.

Варто знати, що «попереднє навчання» великих моделей визначає верхню межу їхніх можливостей, і неможливо за допомогою «післянавчання» досягти рівня здібностей моделі з параметрами на рівні 10 трильйонів, використовуючи модель з параметрами в один трильйон. Ключовим фактором попереднього навчання є високопродуктивні чіпи для обчислень, які визначають масштаб параметрів і швидкість ітерацій навчання.

Генеральний директор iFlytek Лю Цзяньфэн відкрито зазначив, що всі провідні компанії з великих моделей, особливо американські гіганти, зараз будують надвеликі обчислювальні платформи. Наразі вітчизняні обчислювальні ресурси справді перебувають у періоді труднощів, що призводить до обмежень у навчанні на дуже довгих текстових контекстах.

Ясно, що розрив у потужності обчислень є корінням різниці між китайськими та американськими моделями.

Піднесення китайських продуктів

Підприємство монополізує 90% ринкової частки на світовому ринку висококласних чіпів для навчання ШІ — це допомагає NVIDIA зберігати позицію найбільшої за ринковою капіталізацією компанії у світі. Її загальна ринкова капіталізація колись перевищила ВВП Німеччини — третьої за величиною економіки у світі — за 2025 рік.

За даними集邦咨询, у Q1 2026 року NVIDIA зайняла 68% ринку GPU-серверів у світі, AMD — 5–6%, а виробники китайських GPU разом — менше 4%.

Завдяки перевагі першого руху, потужним технічним бар’єрам, високій швидкості з’єднання, програмній екосистемі та партнерству з TSMC у виробництві передових процесів, NVIDIA домінує на ринку. У сценаріях високопродуктивного навчання продуктивність NVIDIA GB300 перевищує AMD MI325, а також китайські рішення Cambricon Siyuan 690 та Moore Threads MTT40, особливо під час навчання моделей з трильйоном параметрів — продуктивність перевищує показники конкурентів більше ніж на 30%.

Незважаючи на заборону на експорт, раніше Хуан Ренсюнь заявив, що частка ринку NVIDIA в Китаї (нові продажі) майже зникла, залишивши лише ринок існуючих продуктів. За підтримки політики заміни імпортних продуктів власними, з’явилися такі компанії, як Huawei Ascend 910, Higon DCU Shen Suan No. 2, Cambricon MLU370/590, а також Moore and Muxi.

昇腾910 є найпотужнішим чіпом Huawei, а昇腾910B має продуктивність 640 TOPS (INT8) і може зрівнятися з чіпом NVIDIA A100.

Щодо абсолютної продуктивності, китайські GPU все ще мають розрив, але можна почати з інференсу та крайових сценаріїв. Наразі китайські GPU в цілому задовольняють загальні потреби в інференсі державних та приватних підприємств у Китаї, а розрив із середніми продуктами NVIDIA скоротився до 15–20%, що робить їх заміну здійсненною.

Варто підкреслити, що хоча продуктивність обчислювальних потужностей важлива, саме технологічна екосистема програмного забезпечення є слабким місцем китайських GPU. Як CUDA є основою імперії GPU NVIDIA, академік Китайської академії інженерних наук Чжэн Веймін зазначив, що основна проблема китайських AI-чіпів полягає в поганій екосистемі: якби екосистема була кращою, навіть при продуктивності 60% їх все одно б використовували.

Можна сказати, що програмне оточення є найбільш суворою перешкодою на ринку GPU, і здатність NVIDIA в цій сфері також важко замінити.

Екосистема CUDA протягом понад десяти років розвивалася і зараз включає понад 4 мільйони розробників, десятки тисяч відкритих моделей та повний спектр інструментів від третіх сторін, охоплюючи навчання й висновки штучного інтелекту, графічну рендерингу та наукові обчислення — її екосистемна бар’єрність неперевершена.

Дані IDC показують, що зараз понад 95% AI-моделей у світі розроблені на основі екосистеми CUDA. Власні GPU, опираючись на підтримку політики, потребують довгострокової координації з ланцюжком поставок, а також достатньої терпіння з боку ЗМІ та ринків капіталу.

У січні цього року Zhipu разом з Huawei відкрила код нової моделі генерації зображень GLM-Image, яка була розроблена на основі пристрою Huawei Ascend Atlas 800T A2 та AI-фреймворку Ascend MindSpore, забезпечивши повний цикл — від обробки даних до навчання моделі — і стала першою SOTA багатомодальною моделлю, навченою повністю на вітчизняних чіпах;

Moore Threads разом з Пекінським інститутом штучного інтелекту Zhiyuan на основі обчислювального кластера MTT S5000 та фреймворку FlagOS-Robo завершила повний цикл навчання моделі RoboBrain 2.5, розробленої Zhiyuan. Цей результат вперше підтвердив придатність китайських обчислювальних кластерів для навчання великих моделей ембодієнту інтелекту.

Видно, що вітчизняні GPU вже досягли прогресу в питаннях сумісності та побудови екосистеми, переходячи від «одноточкового прориву» на стороні висновків до «поступової адаптації» на стороні навчання — це значний прогрес.

Підсумок

Загалом, на тлі перешкод у імпорті передових зарубіжних чіпів, варто поєднати східні та західні підходи, рухаючись двома ногами, одночасно активно підтримуючи внутрішні чіпи для обчислювальних потужностей, щоб задовольнити гостру ринкову потребу.

Реальність попиту не підлягає сумніву, «теорія бульбашки» все ще існує, але її голос не стає все гучнішим. Світовий ринок проявляє ентузіазм щодо розробки ШІ, що перевищує будь-який ранній етап розвитку попередніх галузей.

З початку цього року глобальні фінансові ринки знову переживають суперцикл штучного інтелекту: акції Samsung, SK Hynix, Broadcom та TSMC досягли нових рекордів, а на внутрішньому ринку такі представники жорсткої технології, як Cambricon, також демонструють сильний ріст; ринкова капіталізація лідера оптичних модулів InnoLight навіть тимчасово перевищила ринкову капіталізацію Kweichow Moutai.

Оглядаючи історію розвитку напівпровідникової промисловості Південної Кореї, країна підтримувала галузь пам’яті з усіх сил, пережила найтемніші часи і нарешті перемогла Японію, ставши абсолютним лідером світової індустрії пам’яті.

Щодо чіпів для зберігання, чіпів для смартфонів та навіть сучасних AI-чіпів, Китай все ще перебуває на етапі перегонів — це не може бути досягнуто за один день. Але завдяки величезному ринку, постійно зростаючій кількості AI-фахівців та потужному капіталу, китайські GPU вже починають демонструвати певну сумісність і здатні вирішувати багато реальних потреб AI-компаній.

У цій грі Штатів і Китаю щодо майбутнього, обидві країни є суперниками, але одночасно мають технології, ринки та ресурси, необхідні одній для іншої.

Цей матеріал з іншого каналу WeChat: Juexin WAVE, редагування: Ян Сюйран, автор: Се Цзэфен, початковий заголовок: «Проблеми обчислювальних потужностей під час AI-змагання між Китаєм і США | Juexin WAVE»