Чому штучний інтелект у Китаї розвивається так швидко? Висновки з лабораторій

icon MarsBit
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Сектор Штучного інтелекту в Китаї прискорюється завдяки сильній інженерній спрямованості, відкритій співпраці та командній розробці. Лабораторії пріоритезують виконання замість індивідуального визнання. Відкритий інтерес до активів, пов’язаних з ШІ, зростає, оскільки такі великі компанії, як Alibaba та ByteDance, розширюють свій вплив. Індекс страху та жадоби для ринків ШІ свідчить про зростаючу оптимістичність. Державна підтримка та інфраструктура даних додатково підсилюють цей рух.

Редакційна примітка: Китайські лабораторії штучного інтелекту стають все більш незаперечною силою у глобальній боротьбі за великі моделі. Їхні переваги полягають не лише у величезній кількості талантів, сильній інженерній базі та швидкій ітерації, а й у дуже практичному підході до організації: менше розмов про концепції, більше створення моделей; менше акценту на індивідуальних зірках, більше на командній виконавчості; менше залежності від зовнішніх сервісів, більше прагнення самостійно оволодіти ключовими технологічними стеками.

Після відвідин кількох провідних китайських лабораторій штучного інтелекту автор статті Натан Ламберт виявив, що китайська екосистема ШІ не повністю збігається з американською. США більше зосереджені на оригінальних парадигмах, капітальних інвестиціях та особистому впливі провідних вчених; Китай ж краще впорався зі швидким наздоганянням у вже існуючих напрямках завдяки відкритому коду, інженерній оптимізації та великій кількості молодих дослідників, що дозволило швидко вивести здатності моделей на передовий рівень.

Найважливішим є не те, чи перевершив Китай США в галузі ШІ, а те, що формується два різні шляхи розвитку: США схожі на передову гонку, що рухається капіталом і зірковими лабораторіями, тоді як Китай більше схожий на промислову гонку, що підтримується інженерними здібностями, відкритою екосистемою та свідомістю технологічної самодостатності.

Це означає, що майбутня конкуренція в галузі ШІ буде не лише боротьбою за лідери в рейтингах моделей, а й боротьбою за організаційні здібності, екосистему розробників та промислову виконавчу здатність. Справжні зміни в китайському ШІ полягають у тому, що він більше не просто копіює Сіліконову долину, а бере участь у глобальних передових досягненнях власними методами.

Нижче наведено оригінал:

Сидя у вікна нового швидкісного потяга, що йде з Ханчжоу до Шанхаю, я дивлюся назовні і бачу чітко виражені гребені гір, на яких розташовані вітрові турбіни, що утворюють силуети на тлі заходу сонця. Гіри утворюють тло, а перед очима — величезні поля, переплетені з масивами хмарочосів.

Я повернувся з Китаю з великою скромністю. Бути в такій незнайомій місцевості, але отримати таке тепле та дуже людяне зустріч — це дуже теплий досвід. Мені пощастило зустріти багатьох людей з екосистеми ШІ, яких я раніше знав лише здалеку; вони зустріли мене з радісними посмішками та ентузіазмом, що знову нагадало мені, що моя робота та вся екосистема ШІ є глобальними.

Настрій китайських дослідників

Китайські компанії, що розробляють мовні моделі, можуть бути дуже добре підходящими «швидкими слідувачами» цієї технології. Вони ґрунтуються на довготривалих традиціях китайської освіти та робочої культури, а також мають трохи відмінний підхід до створення технологічних компаній порівняно зі Західом.

Якщо звернути увагу лише на вихід — найновіші та найбільші моделі та робочі процеси, що базуються на агентах — і на вхідні фактори, такі як видатні вчені, масштабні дані та прискорені обчислювальні ресурси, то китайські та американські лабораторії виглядають майже однаково. Справжні довгострокові відмінності виникають у тому, як ці фактори організовані та формуються.

Я завжди вважав, що однією з причин, чому китайські лабораторії чудово справляються зі здобуттям передових позицій, є їхня культурна сумісність із цією задачею. Але до тих пір, поки я не спілкувався безпосередньо з людьми, я не вважав за можливе приписувати цю інтуїцію якомусь важливому впливу. Після розмов з багатьма видатними, скромними та відкритими вченими з провідних китайських лабораторій мої думки стали набагато чіткішими.

Сьогодні створення найкращої великої мовної моделі значною мірою залежить від докладної роботи на всьому технічному стеку: від даних до архітектурних деталей та реалізації алгоритмів підсиленого навчання. Кожен етап моделі може принести певне покращення, а поєднання цих покращень — складний процес. У цьому процесі робота деяких дуже розумних людей може бути відкладена, щоб досягти максимального результату для загальної моделі в багатоцільовій оптимізації.

Американські дослідники, звичайно, також чудово впораються з проблемами окремих компонентів, але в США існує більш сильна культура «говорити за себе». Як науковець, коли ви активно боретеся за увагу до своєї роботи, ви зазвичай досягаєте більшого успіху; сучасна культура також сприяє новому шляху до слави — стати «лідером у галузі штучного інтелекту». Це призводить до прямих конфліктів.

Поширюється чутка, що організація Llama розпалася після того, як ці інтереси були вбудовані в ієрархічну структуру через політичний тиск. Я також чув від інших лабораторій, що іноді потрібно «заспокоїти» провідного дослідника, щоб він припинив скаржитися, що його ідеї не були включені до фінальної моделі. Незалежно від того, наскільки це правда, сенс зрозумілий: самосвідомість і бажання кар’єрного зростання дійсно заважають створенню найкращих моделей. Навіть така мала культурна різниця між США та Китаєм може мати значний вплив на кінцевий результат.

Частина цих відмінностей пов’язана з тим, хто саме створює ці моделі в Китаї. У всіх лабораторіях існує досить очевидна реальність: серед ключових учасників велика частка — це студенти, які ще навчаються. Ці лабораторії досить молоді, що нагадує нам наш підхід до організації в Ai2: студентів сприймають як рівних партнерів і безпосередньо включають до команд з великих мовних моделей.

Це дуже відрізняється від найкращих лабораторій США. У США компанії, такі як OpenAI, Anthropic, Cursor, взагалі не надають інтернів. Інші компанії, такі як Google, формально пропонують інтернship, пов’язаний з Gemini, але багато хто стурбований, чи не буде їхній інтернship ізольований від справжньої ядерної роботи.

Загалом, ці незначні культурні відмінності можуть підвищувати здатність моделей до побудови: люди більш охоче виконують менш відомі завдання, щоб покращити кінцеву модель; початківці, які вперше беруть участь у створенні ШІ, можуть не бути впливаними попередніми циклами штучного інтелекту, що дозволяє їм швидше адаптуватися до сучасних методів. Насправді, один із китайських вчених, з яким я розмовляв, чітко вважав це перевагою: нижчий рівень самосвідомості робить організаційну структуру трохи легшою для масштабування, оскільки люди менше намагаються «обходити систему»; велика кількість фахівців ідеально підходять для вирішення задач, де вже існують підтвердження концепції.

Це більше сприяє розвитку здатностей сучасних мовних моделей і суперечить відомому стереотипу: люди часто вважають, що китайські дослідники менше здійснюють творчих, інноваційних досліджень «від 0 до 1», які відкривають нові напрямки.

Під час кількох більш академічних відвідин лабораторій у цьому турі багато керівників зазначили, що вони виховують більш амбітну дослідницьку культуру. Разом із тим, деякі технічні керівники, з якими ми розмовляли, сумніваються, чи можливо досягти такого перетворення наукових підходів у короткостроковій перспективі, оскільки це вимагає переосмислення освітньої та мотиваційної систем, що є надто великою зміною, щоб відбутися за поточного економічного рівноваги.

Ця культура, схоже, навчає великої кількості студентів і інженерів, які дуже добре володіють «грою з великою мовою моделлю». Звичайно, їх кількість також надзвичайно велика.

Ці студенти сказали мені, що в Китаї теж відбувається подібний відтік кадрів, як у США: багато тих, хто раніше розглядав академічну кар’єру, зараз планують залишитися в індустрії. Найцікавішим було твердження дослідника, який спочатку хотів стати професором, бо хотів бути ближче до освітньої системи; але потім він додав, що освіту вже вирішили великі мовні моделі — «Навіщо студентам тепер приходити до мене на розмову!»

Студенти, які входять у сферу великих мовних моделей зі свіжим поглядом, мають перевагу. За останні роки ми бачили постійну зміну ключових парадигм великих мовних моделей: від масштабування MoE до масштабування підсилювального навчання та підтримки агентів. Щоб успішно виконати будь-яку з цих задач, потрібно дуже швидко засвоїти великий обсяг контекстної інформації — як з широких наукових джерел, так і з технічних стеків, використовуваних у компанії.

Студенти звикли до таких речей і готові з скромністю відкинути всі передумови щодо того, «що має працювати». Вони повністю занурюються в це, вкладаючи своє життя, щоб отримати можливість покращити модель.

Ці студенти також дуже прямо і без філософських розмов, які можуть відволікати вчених. Коли я запитав їх про ставлення до економічного впливу моделей чи довгострокових соціальних ризиків, китайських дослідників із складними поглядами, які бажають впливати на ці питання, було явно менше. Вони вважають, що їхня роль — створювати найкращі моделі.

Ця різниця дуже тонка і легко заперечується. Але її найкраще відчуваєш, коли довго розмовляєш із елегантним, розумним дослідником, який вміє чітко висловлюватися англійською: коли ти задаєш більш філософські питання про ШІ, ці базові питання висіють у повітрі, а людина виявляє просте збентеження. Для них це помилка категорії.

Навіть один дослідник посилався на відому думку Дан Вана: на відміну від США, які керуються юристами, Китай керує інженерами. Під час обговорення цих питань він використовував цю аналогію, щоб підкреслити бажання будувати. У Китаї немає системного шляху, який би, як суперпопулярні подкасти Dwarkesh або Lex, розвивав зірковий вплив китайських вчених.

Я намагався отримати коментарі китайських вчених щодо майбутньої економічної невизначеності, спричиненої ШІ, питань, що виходять за межі простих здібностей AGI, або моральних дискусій щодо того, як повинні поводитися моделі; усі ці питання в кінцевому підсумку дозволили мені побачити їхнє виховання та освіту (редаговано). Вони надзвичайно зосереджені на своїй роботі, але виростали в системі, яка не сприяє обговоренню та висловленню того, як має організовуватися суспільство та як воно має змінюватися.

Коли подивитися здалеку, особливо на Пекін, він мені здається схожим на Бей-Арію: конкурентоспроможна лабораторія, яка може бути за кілька хвилин ходьби або поїздки на таксі. Після прибуття в аеропорт я заїхав до пекінського кампусу Alibaba, а протягом наступних 36 годин ми відвідали Zhipu AI, Moonshot AI, Цинхуа-університет, Meituan, Xiaomi та 01.ai.

У Китаї зручно користуватися Didi. Якщо ви вибираєте автомобіль класу XL, вас часто розміщують у електричному невеликому фургоні з масажними кріслами. Ми запитали дослідників про боротьбу за таланти, і вони сказали, що це дуже схоже на те, що ми пережили в США. Перехід дослідників — це нормально, і люди вибирають, куди йти, залежно від того, де зараз найкраща атмосфера.

У Китаї спільнота великих мовних моделей відчувається як екосистема, а не як племена, що ведуть між собою війну. У багатьох неофіційних розмовах я майже завжди почував повагу до колег. Усі китайські лабораторії дуже стурбовані ByteDance та її популярною моделлю Doubao, оскільки це єдина передова закрита лабораторія в Китаї. Разом з тим, усі лабораторії дуже поважають DeepSeek, вважаючи її лабораторією з найвищим науковим смаком на рівні виконання. У США, коли ви спілкуєтеся з членами лабораторій у неофіційній обстановці, іскри часто швидко розлітаються.

Найбільше мене вразила скромність китайських дослідників: вони часто піднімають плечима і кажуть, що це не їхня справа. У США, здається, кожен захоплений різними індустріальними трендами на екосистемному рівні — від продавців даних, до обчислювальних потужностей та фінансування.

Відмінності та подібності китайської індустрії ШІ та західних лабораторій

Сьогодні створення моделі ШІ цікаве не лише тому, що це більше не просто збірка видатних дослідників в одному будинку для спільної роботи над інженерним чудом. Раніше це дійсно було так, але для підтримки бізнесу ШІ великі мовні моделі перетворюються на гібрид: вони включають розробку, розгортання, фінансування та просування цього творіння серед користувачів.

Лідуючі AI-компанії існують у складних екосистемах. Ці екосистеми надають фінансування, обчислювальні потужності, дані та інші ресурси, щоб постійно рухати межі вперед.

У західній екосистемі способи інтеграції різних ресурсів, необхідних для створення та підтримки великих мовних моделей, вже відносно добре концептуалізовані та відображені. Anthropic та OpenAI є типовими прикладами. Отже, якщо ми зможемо виявити, що китайські лабораторії мають суттєво відмінний підхід до цих питань, це дозволить побачити, на які значущі відмінності можуть зробити ставку різні компанії у майбутньому. Звичайно, ці майбутні також будуть сильно впливати фінансування та/або обмеження обчислювальних потужностей.

Ось основні висновки на «індустріальному рівні AI», отримані після спілкування з цими лабораторіями:

По-перше, у внутрішньому ринку AI вже з’явилися ранні ознаки попиту.
Існує широко обговорювана гіпотеза, що китайський ринок ШІ буде меншим, оскільки китайські компанії зазвичай не хочуть платити за програмне забезпечення, тому ніколи не зможуть створити достатньо великий ринок висновків, щоб підтримати лабораторії.

Але це твердження стосується лише витрат на програмне забезпечення, що відповідають екосистемі SaaS. Екосистема SaaS в Китаї завжди була невеликою. З іншого боку, Китай, зрозуміло, все ще має величезний ринок хмарних технологій.

Одне з ключових і ще не відповідених питань: якими будуть витрати китайських компаній на ШІ — більше схожими на ринок SaaS, тобто меншими за масштабом, чи на ринок хмарних обчислень, тобто фундаментальними витратами? Це питання обговорюється навіть всередині китайських лабораторій. Загалом, на мою думку, ШІ все більше наближається до ринку хмарних обчислень, і ніхто справді не стурбований тим, що ринок, що формується навколо нових інструментів, не зможе зростати.

Друге, більшість розробників глибоко вплинули на Claude.
Хоча Claude формально заборонений у Китаї, більшість китайських розробників ШІ дуже захоплені Claude та тим, як він змінив їхній підхід до створення програмного забезпечення. Те, що Китай раніше не був охочий купувати програмне забезпечення, не означає, що я вважаю, що в Китаї не відбудеться значний ріст попиту на висновування.

Китайські техніки дуже практичні, скромні та мотивовані. Це враження сильніше, ніж будь-яка історична звичка «не купувати програмне забезпечення безкоштовно».

Деякі китайські дослідники згадують, що використовують власні інструменти для побудови, наприклад, командний інтерфейс Kimi або GLM, але всі згадують, що використовують Claude. Дивно, що майже ніхто не згадує Codex, хоча Codex очевидно швидко набирає популярність у Бей-Арії.

Третє, китайські компанії мають налаштування власності на технології.
Китайська культура поєднується з економічним двигуном, що потужно працює, і це породжує деякі важко передбачувані наслідки. Одним із моїх глибоких вражень є велика кількість AI-моделей, які відображають практичну рівновагу, яку багато технологічних компаній тут реалізують у реальному житті. Загального плану не існує.

Ця галузь визначається повагою до ByteDance та Alibaba. Вони вважаються величезними існуючими гравцями, які зможуть виграти багато ринків завдяки своїм могутнім ресурсам. DeepSeek — це поважний технологічний лідер, але далеко не лідер ринку. Вони визначають напрямок, але не мають структури для економічного перемоги на ринку.

Це залишає такі компанії, як Meituan або Ant Group. Західні люди можуть здивуватися, чому вони також розробляють ці моделі. Але насправді вони очевидно вважають великі мовні моделі ядром майбутніх технологічних продуктів, тому їм потрібна потужна основа.

Коли вони доналаштовують потужну універсальну модель, зворотний зв’язок від відкритого ком’юніті робить їхній технічний стек міцнішим, а вони одночасно можуть зберігати внутрішні версії доналаштованих моделей для власних продуктів. «Відкритість перш за все» у цій галузі в значній мірі визначається прагматизмом: це допомагає моделям отримувати сильний зворотний зв’язок, віддавати назад відкритому ком’юніті та підтримувати їхнє власне завдання.

Четверте, підтримка уряду є реальною, але її масштаб невідомий.
Люди часто стверджують, що китайський уряд активно допомагає відкрити змагання з великих мовних моделей. Але це відносно децентралізована система уряду, що складається з багатьох рівнів, і кожен рівень не має чіткого посібника з операцій, який визначає, що саме він повинен робити.

Різні райони Пекіну конкурують між собою, намагаючись привабити технологічні компанії відкривати там свої офіси. «Допомога», що надається цим компаніям, майже напевно включає спрощення бюрократичних процедур, таких як видалення ліцензій. Але наскільки далеко може зайти така допомога? Чи зможуть різні рівні уряду допомогти привабити таланти? Чи зможуть вони допомогти контрабандою чіпів?

За весь час відвідування згадувалося багато про інтерес або допомогу уряду, але цієї інформації далеко не достатньо, щоб я міг повідомити про деталі з впевненістю або сформувати впевнену світоглядну позицію щодо того, як уряд здатний змінити траєкторію розвитку ШІ в Китаї.

Також абсолютно немає жодних ознак того, що найвищий керівництво Китаю впливає на будь-які технічні рішення моделі.

П’яте: галузь даних значно менш розвинена, ніж у західних країнах.
Раніше ми чули, що Anthropic або OpenAI витрачають понад 10 мільйонів доларів США на одну середовище, а щорічні загальні витрати на просування меж підсиленого навчання досягають сотень мільйонів доларів США. Тому нас цікавить, чи купують китайські лабораторії такі ж середовища у американських компаній, чи існує дзеркальний внутрішній екосистемний підход, що їх підтримує.

Відповідь не означає повного «відсутності індустрії даних», а полягає в тому, що, згідно з їхнім досвідом, якість індустрії даних відносно низька, тому часто кращим рішенням є створення власного середовища або даних. Дослідники самі витрачають велику кількість часу на створення середовищ для навчання підсилювального навчання, тоді як більші компанії, такі як ByteDance та Alibaba, можуть мати власні команди з анотації даних для підтримки цього процесу. Все це підтверджує згадану раніше установку «створювати, а не купувати».

Шосте, попит на більше чіпів NVIDIA дуже високий.
Потужність NVIDIA є золотим стандартом для навчання, і прогрес кожного обмежений відсутністю додаткової потужності. Якби постачання було достатнім, вони, звичайно, купували б їх. Інші прискорювачі, включаючи Huawei, отримали позитивні відгуки щодо висновків. Численні лабораторії мають доступ до чипів Huawei.

Ці пункти малюють дуже іншу екосистему ШІ. Спроби швидко застосувати спосіб роботи західних лабораторій до китайських колег часто призводять до помилок категорій. Ключове питання полягає в тому, чи призведуть ці різні екосистеми до створення моделей із суттєвими відмінностями, чи китайські моделі завжди будуть інтерпретуватися як аналоги передових американських моделей, що були за 3–9 місяців до цього.

Висновок: Глобальна рівновага

Перед цією подорожжю я дуже мало знав про Китай; а коли відправлявся геть, відчув, що лише почав вчитися. Китай — це не місце, яке можна описати за допомогою правил чи рецептів, а місце з дуже відмінними механізмами та хімічними реакціями. Його культура настільки давня, настільки глибока і все ще повністю переплетена зі способом, яким у країні будують технології. Мені ще багато що потрібно дізнатися.

Багато елементів поточного американського політичного устрою використовують свою існуючу думку про Китай як ключовий психологічний інструмент при прийнятті рішень. Після офіційних та неофіційних особистих зустрічей майже з усіма провідними лабораторіями ШІ в Китаї, я виявив, що в Китаї є багато якостей і інстинктів, які важко моделювати за допомогою західних підходів до прийняття рішень.

Навіть якщо я безпосередньо запитую ці лабораторії, чому вони публікують свої найпотужніші моделі, мені все ще важко повністю з’єднати «ментальність власності» і «щире підтримування екосистеми».

Ця лабораторія дуже практична і не є абсолютним прихильником відкритого коду — не кожна модель, яку вони розробляють, публікується відкрито. Але вони мають глибоку мету підтримувати розробників, екосистему та використовувати відкритість як спосіб краще зрозуміти власні моделі.

Майже кожна велика китайська технологічна компанія розробляє власну універсальну велику мовну модель. Ми вже бачили, що платформенні сервіси, такі як Meituan, та великі споживчі технологічні компанії, як Xiaomi, опублікували моделі з відкритими вагами. Американські аналоги зазвичай просто купують сервіси.

Ці компанії розробляють великі мовні моделі не для того, щоб здобути увагу в ході популярних новинок, а через глибоку та фундаментальну бажання контролювати власний технологічний стек та розвивати найважливіші на сьогодні технології. Коли я піднімаю погляд з ноутбука, я завжди бачу на горизонті групи кранів — це явно відповідає більш широкій китайській культурі будівництва та будівельній енергетиці.

Китайські дослідники викликають відчуття близькості завдяки своїй людяності, харизмі та щирій теплоті. На особистому рівні та та жорстока геополітична дискусія, до якої ми звикли в США, зовсім не проникла до них. Цей світ може мати більше такої простої позитивності. Як член спільноти штучного інтелекту, зараз я більше хвилююся про те, що між членами та групами, навколо національних ярликів, з’являються розколи.

Я би брехав, якби сказав, що не хочу, щоб американські лабораторії стали очевидними лідерами в кожній частині стеку штучного інтелекту. Особливо в галузі відкритих моделей, де я вклали багато часу — я американець, і це чесна симпатія.

Тим часом я бажаю, щоб відкрита екосистема сама по собі процвітала по всьому світу, оскільки це може створити для світу більш безпечну, доступну та корисну ШІ. Проте зараз питання полягає в тому, чи вживають дій美国 лабораторії для зайняття цієї лідерської позиції.

Поки я писав цю статтю, поширювалися ще більше чуток про вплив адміністративного указу на відкриті моделі. Це може ще більше ускладнити співпрацю між американським лідерством та глобальною екосистемою — що не робить мене більш впевненим.

Дякую всім відмінним людям, з якими мені пощастило спілкуватися в Moonshot, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai та інших організаціях. Кожен був надзвичайно захоплений і щедро віддавав свій час. По мірі того як мої ідеї набирають форми, я продовжуватиму ділитися спостереженнями щодо Китаю — як у ширшому культурному контексті, так і в самій галузі ШІ.

Звичайно, ці знання безпосередньо пов’язані з історією, яка розгортається на передовому фронті штучного інтелекту.

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.