Редакционная заметка: Китайские лаборатории ИИ становятся все более значимой силой в глобальной конкуренции крупных моделей. Их преимущество заключается не только в большом количестве талантов, сильной инженерной базе и быстрой итерации, но и в реалистичной организационной модели: меньше говорить о концепциях, больше создавать модели; меньше акцентировать внимание на индивидуальных звездах, больше — на командном исполнении; меньше полагаться на внешние сервисы, больше стремиться к собственному контролю над технологическим стеком.

После посещения нескольких ведущих китайских лабораторий ИИ автор статьи Натан Ламберт обнаружил, что экосистема ИИ в Китае отличается от американской. В США больше внимания уделяется оригинальным парадигмам, капиталовложениям и личному влиянию ведущих ученых; в Китае же лучше получается быстро догонять уже существующие направления за счет открытого кода, инженерной оптимизации и большого вклада молодых исследователей, что позволяет быстро выводить возможности моделей на передний край.

Самое важное — не то, превзошла ли Китайская ИИ-индустрия американскую, а то, что формируются два разных пути развития: США скорее напоминают передовую гонку, движимую капиталом и звездными лабораториями, тогда как Китай — это отраслевая гонка, продвигаемая инженерными возможностями, открытой экосистемой и осознанием технологической автономии.

Это означает, что будущая конкуренция в области ИИ будет не только за места в рейтингах моделей, но и за организационные способности, экосистему разработчиков и промышленную исполнительную мощь. Настоящие изменения в китайском ИИ заключаются в том, что он больше не просто копирует Силиконовую долину, а участвует в глобальных передовых разработках своим собственным способом.

Следует отметить, что:

Сидя в новом высокоскоростном поезде из Ханчжоу в Шанхай, я смотрю в окно и вижу четко выраженные хребты гор, на которых разбросаны ветровые турбины, создающие силуэты на фоне заката. Горы служат фоном, а перед глазами — обширные поля, переплетающиеся с рядами высотных зданий.

Я с большим смирением вернулся из Китая. Попасть в такое чужое место и встретить такой тёплый и сердечный приём — это было очень тёплое и человечное переживание. Мне посчастливилось встретиться с многими людьми из экосистемы ИИ, которых я раньше знал только издалека; они встретили меня радостными улыбками и энтузиазмом, напомнив мне, что моя работа и вся экосистема ИИ в целом носят глобальный характер.

Менталитет китайских исследователей

Китайские компании, разрабатывающие языковые модели, могут быть очень хорошо подходящими «быстрыми последователями» для этой технологии. Они основаны на давних китайских традициях образования и рабочей культуры, а также используют несколько иной подход к созданию технологических компаний по сравнению с западным.

Если рассматривать только результаты — самые новые и мощные модели, а также рабочие процессы на основе агентов, которые они поддерживают, — и факторы вложений, такие как выдающиеся ученые, масштабные данные и ускоренные вычислительные ресурсы, то китайские и американские лаборатории выглядят в целом схожими. Настоящие долгосрочные различия проявляются в том, как эти элементы организованы и формируются.

Я всегда считал, что одной из причин, по которым китайские лаборатории так хорошо справляются с догонянием и удержанием позиций на переднем крае, является их культурная совместимость с этой задачей. Однако до тех пор, пока я не пообщался напрямую с людьми, я не чувствовал, что могу приписать эту интуицию какому-либо значимому влиянию. После разговоров со многими выдающимися, скромными и открытыми учеными из ведущих китайских лабораторий мои представления стали гораздо яснее.

Сегодня создание лучшей крупной языковой модели во многом зависит от тщательной работы на всем протяжении технологического стека: от данных до архитектурных деталей и реализации алгоритмов усиленного обучения. Каждый этап модели может принести некоторое улучшение, и объединение этих улучшений — сложный процесс. В ходе этого процесса работа некоторых очень талантливых людей может быть отложена, чтобы обеспечить максимальную оптимизацию всей модели по нескольким целям.

Американские исследователи, очевидно, также отлично справляются с решением проблем отдельных компонентов, но в Америке существует более выраженная культура «отстаивания своих интересов». Как ученому, когда вы активно добиваетесь внимания к своей работе, вы, как правило, достигаете большего успеха; современная культура также продвигает новый путь к славе — стать «ведущим ученым в области ИИ». Это вызывает прямой конфликт.

Широко распространены слухи, что организация Llama развалилась после введения иерархической структуры для учета этих интересов под политическим давлением. Я также слышал от других лабораторий, что иногда необходимо «успокоить» ведущего исследователя, чтобы он перестал жаловаться, что его идеи не были включены в финальную модель. Независимо от того, насколько это правдиво, смысл ясен: самосознание и стремление к карьерному росту действительно мешают созданию наилучших моделей. Даже небольшая культурная разница в направлении между США и Китаем может оказать значимое влияние на конечный результат.

Часть этих различий связана с тем, кто именно в Китае создает эти модели. Во всех лабораториях очевидна следующая реальность: значительная доля ключевых участников — это студенты, обучающиеся в настоящее время. Эти лаборатории достаточно молоды, что напоминает нам о том, как мы организуем работу в Ai2: студенты рассматриваются как равные и непосредственно включаются в команды по разработке крупных языковых моделей.

Это сильно отличается от ведущих лабораторий в США. В США такие компании, как OpenAI, Anthropic и Cursor, вообще не предлагают стажировки. Другие компании, такие как Google, формально предлагают стажировки, связанные с Gemini, но многие опасаются, что их стажировка будет изолирована от настоящей ключевой работы.

В целом, эти незначительные культурные различия могут улучшить способность моделирования следующим образом: для улучшения конечной модели люди охотнее занимаются менее привлекательной работой; новые участники создания ИИ, возможно, не подвержены влиянию предыдущих циклов ажиотажа вокруг ИИ, что позволяет им быстрее адаптироваться к современным методам; на самом деле, один из китайских ученых, с которым я общался, прямо указал на это как на преимущество: более низкий уровень самосознания делает организационную структуру в некоторой степени легче масштабируемой, поскольку люди реже пытаются «обмануть систему»; большое количество талантов отлично подходит для решения задач, где уже есть доказательства концепции в других местах, и т.д.

Это больше способствует развитию способностей современных языковых моделей, что контрастирует с известным стереотипом: люди часто считают, что китайские исследователи реже создают более креативные, открывающие новые области исследования «от нуля до единицы».

Во время нескольких более академических посещений лабораторий в рамках этой поездки многие руководители отметили, что они способствуют формированию более амбициозной исследовательской культуры. В то же время некоторые технические руководители, с которыми мы беседовали, сомневаются, что такое переосмысление научного подхода возможно в краткосрочной перспективе, поскольку оно требует перестройки образовательной и стимулирующей систем, что является слишком масштабным преобразованием для осуществления при текущем экономическом равновесии.

Эта культура, похоже, готовит целую плеяду студентов и инженеров, отлично владеющих «игрой в построение больших языковых моделей». Конечно, их количество также чрезвычайно велико.

Эти студенты сказали мне, что в Китае также происходит аналогичный отток талантов, как в США: многие, кто ранее планировал карьеру в академической сфере, теперь намерены остаться в промышленности. Самой интересной фразой стала заявление исследователя, который изначально хотел стать профессором, потому что хотел быть ближе к образовательной системе; однако он затем добавил, что образование уже решено с помощью крупных языковых моделей: «Зачем студентам теперь приходить ко мне на разговор!»

Студенты, входящие в область больших языковых моделей с новым взглядом, имеют это преимущество. За последние несколько лет мы наблюдали постоянные изменения ключевых парадигм больших языковых моделей: от масштабирования MoE до масштабирования обучения с подкреплением и поддержки агентов. Для успешного выполнения любого из этих направлений требуется чрезвычайно быстрое усвоение огромного объема контекстной информации — как из более широкой научной литературы, так и из внутренних технологических стеков компании.

Студенты привыкли заниматься подобным и готовы с скромностью отложить в сторону все предположения о том, что должно работать. Они погружаются в это полностью, вкладывая всю свою жизнь, лишь бы получить возможность улучшить модель.

Эти студенты также удивительно прямолинейны и не впадают в философские отступления, которые могут отвлечь ученых. Когда я спросил их о восприятии экономического влияния модели или долгосрочных социальных рисках, китайских исследователей с комплексными взглядами, желающих повлиять на эти вопросы, оказалось значительно меньше. Они считают своей задачей создание наилучших моделей.

Эта разница тонкая и легко отрицаемая. Но она наиболее ощутима, когда вы долго общаетесь с элегантным, умным исследователем, способным ясно выражать мысли на английском языке: когда вы задаете более философские вопросы об ИИ, эти базовые вопросы висят в воздухе, и на лице собеседника появляется простое недоумение. Для них это ошибка категории.

Даже один исследователь сослался на известное утверждение Дан Ванга: в отличие от США, где доминируют юристы, Китай управляется инженерами. При обсуждении этих вопросов он использовал эту аналогию, чтобы подчеркнуть свое желание строить. В Китае нет системного пути, который мог бы воспитать звездную популярность китайских ученых, подобно суперпопулярным подкастам, таким как Dwarkesh или Lex.

Я пытался заставить китайских ученых прокомментировать будущую экономическую неопределенность, вызванную ИИ, вопросы, выходящие за рамки простых возможностей AGI, или этические споры о том, как должны вести себя модели; в конечном итоге все эти вопросы позволили мне увидеть их воспитание и образование (отредактировано). Они чрезвычайно сосредоточены на своей работе, но выросли в системе, которая не поощряет обсуждение и выражение того, как должно организовываться общество и как оно должно меняться.

Когда смотришь на это с более широкой точки зрения, особенно на Пекин, у меня складывается впечатление, будто это Бей-Айленд: конкурентная лаборатория, которая может находиться всего в нескольких минутах ходьбы или поездки на такси. После приземления я заехал в кампус Alibaba в Пекине по пути в отель. В течение следующих 36 часов мы посетили Zhipu AI, Moonshot AI, Цинхуа-университет, Meituan, Xiaomi и 01.ai.

В Китае удобно пользоваться сервисом DiDi. Если вы выбираете автомобиль класса XL, вам часто выделяют электрический минивэн с массажными сиденьями. Мы спросили исследователей о борьбе за таланты, и они сказали, что это очень похоже на то, что мы переживали в США. Смена места работы исследователями — нормальное явление, и люди выбирают, куда идти, в основном исходя из того, где сейчас лучшая атмосфера.

В Китае сообщество крупных языковых моделей воспринимается скорее как экосистема, а не как племена, враждующие друг с другом. Во многих закрытых разговорах я слышал почти исключительно уважение к коллегам. Все китайские лаборатории опасаются ByteDance и ее популярной модели Doubao, поскольку это единственная передовая закрытая лаборатория в Китае. В то же время все лаборатории глубоко уважают DeepSeek, считая ее лабораторией с наибольшим научным вкусом на уровне реализации. В США, когда вы ведете закрытые беседы с членами лабораторий, искры часто начинают лететь сразу.

Самым впечатляющим для меня в скромности китайских исследователей является то, что они часто пожимают плечами и говорят, что это не их проблема, даже на коммерческом уровне. В США, кажется, каждый одержим различными отраслевыми тенденциями на экосистемном уровне — от продавцов данных до вычислительных мощностей и финансирования.

Отличия и сходства китайской индустрии ИИ и западных лабораторий

Сегодня создание ИИ-модели стало таким интересным, потому что это уже не просто сбор группы выдающихся исследователей в одном здании для совместной работы над инженерным чудом. Раньше это действительно было так, но для поддержания ИИ-бизнеса крупные языковые модели превращаются в гибрид: они включают в себя создание, развертывание, финансирование и продвижение внедрения этого творения.

Крупнейшие ИИ-компании существуют в сложных экосистемах. Эти экосистемы обеспечивают финансирование, вычислительные мощности, данные и другие ресурсы для постоянного продвижения передовых технологий.

В западной экосистеме способы интеграции различных ресурсов, необходимых для создания и поддержания крупных языковых моделей, уже относительно хорошо концептуализированы и визуализированы. Anthropic и OpenAI являются типичными примерами. Следовательно, если мы сможем выявить существенные различия в подходах к этим вопросам китайских лабораторий, это поможет понять, на каких значимых различиях компании могут сделать ставку в будущем. Конечно, эти будущие сценарии также будут сильно влиять финансирование и/или ограничения вычислительных мощностей.

Ниже приведены основные выводы на «промышленном уровне ИИ», полученные после общения с этими лабораториями:

Во-первых, внутри страны уже появились ранние признаки спроса на ИИ.
Существует широко обсуждаемая гипотеза, согласно которой китайский рынок ИИ будет меньше, поскольку китайские компании обычно не хотят платить за программное обеспечение, и поэтому никогда не смогут создать достаточный рынок вывода для поддержки лабораторий.

Однако это суждение применимо только к расходам на программное обеспечение, соответствующие экосистеме SaaS, которая в Китае исторически была небольшой. С другой стороны, Китай, очевидно, по-прежнему имеет огромный рынок облачных услуг.

Один из ключевых и пока неотвеченных вопросов: будут ли расходы китайских компаний на ИИ скорее похожи на рынок SaaS — то есть небольшого масштаба — или на рынок облачных услуг — то есть фундаментальные расходы. Этот вопрос обсуждается даже внутри китайских лабораторий. В целом, я чувствую, что ИИ все больше приближается к рынку облачных услуг, и никто по-настоящему не беспокоится о том, что рынок, сформированный новыми инструментами, не сможет расти.

Во-вторых, большинство разработчиков сильно подвержены влиянию Claude.
Несмотря на то, что Claude формально запрещен в Китае, большинство китайских разработчиков ИИ безумно увлечены Claude и тем, как он изменил их подход к созданию программного обеспечения. То, что Китай ранее не был склонен покупать программное обеспечение, не означает, что я не ожидаю огромного роста спроса на вычислительные мощности в Китае.

Китайские технические специалисты очень практичны, скромны и мотивированы. Это впечатление у меня сильнее, чем любые исторические привычки «не платить за программное обеспечение».

Некоторые китайские исследователи упоминают, что используют собственные инструменты для построения, такие как командные строки Kimi или GLM, но все без исключения отмечают, что используют Claude. Неожиданно мало кто упоминает Codex, хотя Codex явно быстро набирает популярность в Заливе.

В-третьих, китайские компании обладают менталитетом владения технологиями.
Китайская культура сочетается с мощным экономическим двигателем, порождая труднопредсказуемые результаты. Одним из самых ярких впечатлений, которые у меня остались, является огромное количество моделей ИИ, отражающих практичный баланс, существующий среди многих технологических компаний здесь. Единого плана не существует.

Эта отрасль определяется уважением к ByteDance и Alibaba. Это крупные игроки, считающиеся способными одержать победу на многих рынках благодаря своим мощным ресурсам. DeepSeek — уважаемый технологический лидер, но далеко не лидер рынка. Они задают направление, но не обладают структурой для экономической победы на рынке.

Это оставляет такие компании, как Meituan или Ant Group. Западные наблюдатели могут удивиться, почему и они также разрабатывают эти модели. На самом деле, они очевидно рассматривают крупные языковые модели как ядро будущих технологических продуктов и поэтому нуждаются в надежной базе.

Когда они тонко настраивают мощную универсальную модель, обратная связь от открытого сообщества делает их технологический стек более устойчивым, одновременно позволяя им сохранять внутренние версии тонкой настройки для своих продуктов. «Открытость в приоритете» в этой отрасли в значительной степени определяется прагматизмом: это помогает модели получать качественную обратную связь, вносить вклад в открытое сообщество и поддерживать собственную миссию.

В четвертых, государственная поддержка существует, но ее масштаб неизвестен.
Часто утверждают, что китайское правительство активно помогает открыть конкурс больших языковых моделей. Но это относительно децентрализованная система правительства, состоящая из многих уровней, и на каждом уровне нет четкого руководства, определяющего, что именно следует делать.

Разные районы Пекина конкурируют друг с другом, стремясь привлечь технологические компании для размещения своих офисов. «Помощь», предоставляемая этим компаниям, почти наверняка включает упрощение бюрократических процедур, таких как отмена лицензий. Но насколько далеко может зайти такая помощь? Могут ли различные уровни правительства помочь привлечь квалифицированных кадров? Могут ли они помочь в контрабанде чипов?

В течение всего визита действительно было много упоминаний о заинтересованности или помощи со стороны правительства, но соответствующей информации远远不足以让我以断言的方式报告细节，也不足以让我对政府究竟能如何改变中国 AI 发展轨迹形成一个自信的世界观。

Кроме того, совершенно нет признаков того, что высшее руководство Китая влияет на какие-либо технические решения модели.

Пятое, отрасль данных далеко не так развита, как на Западе.
Ранее мы слышали, что Anthropic или OpenAI тратят более 10 миллионов долларов на одну среду, а ежегодные совокупные расходы на продвижение передовых технологий усиленного обучения достигают сотен миллионов долларов. Поэтому нас интересует, покупают ли китайские лаборатории те же среды у американских компаний или существует зеркальная внутренняя экосистема, которая их поддерживает.

Ответ не означает полного отсутствия индустрии данных, а скорее указывает на то, что, согласно их опыту, качество индустрии данных относительно низкое, поэтому зачастую лучше создавать среду или данные самостоятельно. Исследователи тратят значительное количество времени на создание сред для обучения с подкреплением, а такие крупные компании, как ByteDance и Alibaba, могут иметь внутренние команды по аннотации данных для поддержки этого процесса. Все это подтверждает упомянутый ранее подход «создавать, а не покупать».

В-шестых, спрос на дополнительные чипы NVIDIA очень высок.
Вычислительные мощности NVIDIA являются золотым стандартом для обучения, и прогресс каждого ограничен отсутствием дополнительных вычислительных мощностей. При достаточном предложении они, очевидно, купят их. Другие ускорители, включая, помимо прочего, Huawei, получили положительные отзывы в области вывода. Бесчисленные лаборатории могут использовать чипы Huawei.

Эти моменты описывают совершенно иную экосистему ИИ. Попытка быстро применить модель работы западных лабораторий к китайским коллегам часто приводит к ошибкам категорий. Ключевой вопрос заключается в том, будут ли эти различные экосистемы порождать модели с существенными различиями или китайские модели всегда будут интерпретироваться как аналоги передовых американских моделей, устаревших на 3–9 месяцев.

Заключение: Глобальное равновесие

Перед этой поездкой я слишком мало знал о Китае; а когда уезжал, почувствовал, что только начал учиться. Китай — это место, которое нельзя описать правилами или рецептами, это место с совершенно иными механизмами и химическими реакциями. Его культура настолько древняя и глубокая, что до сих пор полностью переплетена с тем, как внутри страны строятся технологии. Мне еще многое предстоит узнать.

Многие элементы нынешней американской системы власти используют свое существующее восприятие Китая как ключевой психологический инструмент при принятии решений. После официальных и неофициальных личных встреч с почти всеми ведущими лабораториями ИИ в Китае я обнаружил, что у Китая есть множество качеств и инстинктов, которые трудно смоделировать с помощью западных подходов к принятию решений.

Даже если я прямо спрашиваю эти лаборатории, почему они открывают свои самые мощные модели, мне все еще сложно полностью соединить «менталитет собственности» и «искреннюю поддержку экосистемы».

Здесь лаборатория очень практична и не является абсолютным сторонником открытого исходного кода — не каждая созданная ими модель публикуется открыто. Однако у них есть серьезные намерения поддерживать разработчиков, экосистему и использовать открытость как способ лучше понять собственные модели.

Почти каждая крупная китайская технологическая компания разрабатывает собственную универсальную крупную языковую модель. Мы уже видели, что платформенные компании, такие как Meituan, и крупные потребительские технологические компании, такие как Xiaomi, выпустили модели с открытыми весами. Аналогичные компании в США обычно просто покупают услуги.

Эти компании разрабатывают крупные языковые модели не для того, чтобы заявить о себе на фоне популярных новинок, а из-за глубокой и фундаментальной потребности: контролировать собственный технологический стек и развивать наиболее важные технологии сегодня. Когда я поднимаю глаза от ноутбука, я всегда вижу на горизонте кучи кранов — это явно соответствует более широкой китайской культуре строительства и строительной энергии.

Китайские исследователи обладают человечностью, харизмой и искренним теплом, что вызывает ощущение близости. На личном уровне那种 жестокие геополитические дискуссии, к которым мы привыкли в США, совершенно не проникли в них. Мир может иметь больше такого простого позитива. Как член сообщества ИИ, я теперь больше беспокоюсь о том, что между участниками и группами, вокруг ярлыков гражданства, начинают появляться трещины.

Если бы я сказал, что не хочу, чтобы американские лаборатории стали явными лидерами на каждом этапе стека ИИ, я бы лгал. Особенно в области открытых моделей, в которую я вложил много времени, я американец, и это честное предпочтение.

В то же время я надеюсь, что открытая экосистема сама по себе будет процветать по всему миру, поскольку это может создать для мира более безопасный, доступный и полезный ИИ. Проблема сейчас в том, будут ли американские лаборатории предпринимать действия, чтобы занять эту лидирующую позицию.

Пока я писал эту статью, продолжали распространяться слухи о том, как административные указы влияют на открытые модели. Это может еще больше осложнить взаимодействие между лидерством США и глобальной экосистемой — что не прибавляет мне уверенности.

Благодарю всех замечательных людей, с которыми мне посчастливилось пообщаться в Moonshot, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai и других организациях. Каждый был настолько теплым и щедро потратил свое время. По мере того как мои идеи будут оформляться, я продолжу делиться своими наблюдениями о Китае — как в более широком культурном контексте, так и в самой области ИИ.

Очевидно, эти знания напрямую связаны с историей, которая разворачивается в передовой области ИИ.

Почему ИИ в Китае развивается так быстро? Инсайты из лабораторий

Менталитет китайских исследователей

Отличия и сходства китайской индустрии ИИ и западных лабораторий

Заключение: Глобальное равновесие