Автор: Чэнь Юньда
Согласно сообщению ZhiXiDong от 27 марта, сегодня на форуме Чжунцзяньцань генеральный директор Zhipu Чжан Пэн, генеральный директор Moonshot AI Ян Чжилин (выступал в роли ведущего), руководитель крупной модели MiMo от Xiaomi Ло Фули, генеральный директор Wuwen Xinqiong Ся Ли сюэ и доцент Гонконгского университета Хуан Чао впервые вместе выступили с глубоким диалогом о будущем открытых крупных моделей и агентов.
Этот диалог начинается с самого популярного на данный момент OpenClaw, и все участники согласны, что агенты заставляют крупные модели действительно «работать». OpenClaw расширяет границы возможностей крупных моделей, но также предъявляет к ним более высокие требования. Zhipu исследует такие возможности, как долгосрочное планирование и самодиагностика, в то время как команда Ло Фули сосредоточена на снижении затрат и повышении скорости за счет инноваций в архитектуре, а также на достижении саморазвития модели.
Инфраструктура также должна идти в ногу с агентами. Ся Лисюэ считает, что текущие вычислительные системы и программная архитектура все еще созданы для людей, а не для агентов, и фактически возможности человека ограничивают потенциал агентов. Поэтому нам необходимо создать Agentic Infra.
По мнению нескольких гостей, открытый исходный код является одним из ключевых движущих сил развития крупных моделей и агентов. Ассистент-профессор Гонконгского университета Хуан Чжао считает, что процветание экосистемы с открытым исходным кодом является ключом к тому, чтобы агенты перешли от «простого развлечения» к настоящей «работе». Только через совместное участие сообщества можно полностью перевести программное обеспечение, данные и технологии в форму, изначально предназначенную для агентов, и в конечном итоге сформировать устойчивую глобальную экосистему ИИ.
Кроме того, несколько гостей обсудили такие темы, как рост цен на крупные модели, взрывной рост использования токенов и ключевые слова для ИИ в ближайшие 12 месяцев. Ниже приведены основные идеи этого круглого стола:
1. Чжан Пэн: После увеличения размера модели стоимость вывода также возрастает; недавнее повышение цен со стороны Zhipu на самом деле возвращает модель к её нормальной коммерческой стоимости, а длительная конкуренция по низким ценам вредит развитию отрасли.
2. Чжан Пэн: Всплеск новых технологий, таких как агенты, привёл к десятикратному росту спроса на токены, однако реальный спрос может вырасти в сто раз, и значительная часть потребностей пока не удовлетворена; поэтому вычислительные мощности останутся ключевой проблемой в ближайшие 12 месяцев.
3. Ло Фули: С точки зрения производителей базовых крупных моделей, OpenClaw обеспечивает нижний порог базовых крупных моделей и повышает верхний предел. Уровень выполнения задач для китайских открытых моделей + OpenClaw уже очень близок к Claude.
4. Ло Фули: DeepSeek дал китайским производителям крупных моделей смелость и уверенность. Некоторые инновации в архитектуре моделей, которые казались компромиссом ради эффективности, вызвали настоящие изменения, позволив отрасли достичь максимального уровня интеллекта при фиксированной вычислительной мощности.
5. Ло Фули: Самым важным событием в течение следующего года в развитии AGI станет «саморазвитие». Саморазвитие позволяет крупным моделям исследовать, как ведущие ученые, и является единственным местом, где можно «создавать новое». Xiaomi уже с помощью Claude Code и передовых моделей повысила эффективность исследований в 10 раз.
6. Ся Лисюэ: Когда наступит эра AGI, инфраструктура сама должна быть агентом, автономно управлять всей инфраструктурой и итерировать её в соответствии с потребностями AI-клиентов, обеспечивая самоэволюцию и самообновление.
7. Ся Лисюэ: OpenClaw взорвал использование токенов. Текущая скорость потребления токенов напоминает ощущение начала эпохи 3G, когда у мобильных телефонов было всего 100 МБ трафика в месяц.
8. Хуан Чжао: В будущем многие программы будут созданы не для людей — программы, данные и технологии примут форму Agent-Native, и людям в будущем, возможно, потребуется использовать только те «GUI, которые доставляют удовольствие».
Полная расшифровка этого круглого стола:
01. OpenClaw — это просто «скелет», потребление токенов крупных моделей всё ещё находится на уровне эпохи 3G
Ян Чжилинь: Мне большая честь пригласить сегодня таких выдающихся гостей; наши гости представляют уровни модели, вычислительных ресурсов и агентов. Главными ключевыми словами сегодня являются открытый исходный код и агенты.
Первый вопрос — поговорим о сегодняшней самой популярной OpenClaw. Что, по вашему мнению, наиболее впечатляет или вызывает воображение в повседневном использовании OpenClaw или подобных продуктов? С технической точки зрения, как вы оцениваете эволюцию OpenClaw и связанных с ней агентов сегодня?

Чжан Пэн: Я начал самостоятельно играть в OpenClaw еще тогда, когда он назывался Clawbot. Я сам занимался настройкой, ведь я программист, и у меня был свой опыт работы с такими вещами.
Я считаю, что главное достижение и новизна OpenClaw заключаются в том, что она больше не является прерогативой программистов или энтузиастов. Обычные пользователи теперь могут легко использовать возможности передовых моделей, особенно в области программирования и агентов.
Поэтому за весь период общения с вами я предпочитаю называть OpenClaw «скелетом». Он предоставляет возможность создать прочную, удобную, но гибкую конструкцию на основе моделей, позволяя вам использовать множество новых функций, предлагаемых базовыми моделями, по своему усмотрению.
Раньше мои идеи могли ограничиваться отсутствием навыков программирования или других связанных навыков, но сегодня, благодаря OpenClaw, я могу реализовать их всего лишь с помощью простого общения.
OpenClaw сильно меня поразил, или, можно сказать, заставил меня по-новому взглянуть на это.

Ся Лисюэ: На самом деле, когда я впервые начала использовать OpenClaw, мне было непривычно, потому что я привыкла к общению с крупными моделями, и после использования я почувствовала, что OpenClaw реагирует слишком медленно.
Но позже я осознал одну проблему: оно сильно отличается от предыдущего чат-бота, поскольку по сути является «человеком», который может помочь мне выполнить крупные задачи. Когда я начал давать ему более сложные задачи, я понял, что оно справляется с ними очень хорошо.
Это событие глубоко меня впечатлило. Модель изначально общалась на основе токенов, а теперь превратилась в агента, даже в рака, который может помогать вам выполнять задачи. Это значительно расширяет воображаемые возможности ИИ.
В то же время, это значительно повышает требования к способностям всей системы. Именно поэтому, когда я впервые использовал OpenClaw, мне показалось, что он немного тормозит. Как поставщик инфраструктурного уровня, я вижу, что OpenClaw открывает перед крупными системами и экосистемой, лежащими в основе ИИ, новые возможности и вызовы.
Всех ресурсов, которыми мы сейчас располагаем, недостаточно, чтобы поддержать такую эпоху быстрого роста. Например, в нашей компании с конца января объем использования токенов удваивался примерно каждые две недели и сейчас увеличился в десять раз.
В последний раз я видел такую скорость, когда пользовался 3G-телефоном и тратил мобильный трафик. У меня возникает ощущение, что текущее потребление токенов напоминает те времена, когда у меня было всего 100 МБ мобильного трафика в месяц.
В такой ситуации нам необходимо лучше оптимизировать и интегрировать все наши ресурсы, чтобы каждый человек — не только в области ИИ, но и во всем обществе — мог использовать возможности ИИ OpenClaw.
Как участник инфраструктуры, я очень вдохновлён и глубоко тронут этим временем. Я также считаю, что здесь есть много возможностей для улучшения, которые мы всё ещё должны исследовать и пробовать.
02. OpenClaw повышает потолок для отечественных моделей, прорыв в интерактивном режиме имеет большое значение
Ло Фули: Я сама воспринимаю OpenClaw как революционное и кардинально изменяющее ситуацию событие в процессе эволюции агентной платформы.
На самом деле, все, кто занимаются очень глубоким кодированием вокруг меня, в первую очередь выбирают Claude Code. Но я уверен, что пользователи OpenClaw почувствуют, что многие его дизайнерские решения в рамках агентной архитектуры опережают Claude Code. Последние обновления Claude Code во многом направлены на сближение с OpenClaw.
Когда я использую OpenClaw, я чувствую, что эта рамка значительно расширяет мою фантазию в любое время и в любом месте. Claude Code изначально мог расширять мои идеи только на моём рабочем столе, но OpenClaw позволяет расширять мои идеи в любое время и в любом месте.
Основные ценности, которые приносит OpenClaw, заключаются в двух пунктах. Первый — это его открытый исходный код. Открытый исходный код крайне способствует глубокому вовлечению всего сообщества, вниманию и продвижению эволюции этой рамки, что является важным предварительным условием.
Я считаю, что большое преимущество таких AI-фреймворков, как OpenClaw, заключается в том, что они значительно повышают потолок для моделей внутри страны, уровень которых близок к закрытым моделям, но еще не полностью их догнал.
В подавляющем большинстве сценариев вы обнаружите, что степень выполнения задач этим (отечественной открытой моделью + OpenClaw) очень близка к последней модели Claude. При этом он также надежно обеспечивает минимальный порог — благодаря системе Harness или другим аспектам дизайна, таким как его система навыков, гарантируется полнота и точность выполнения задач.
В целом, с точки зрения разработчиков компаний, создающих базовые крупные модели, OpenClaw обеспечивает нижний порог базовой крупной модели и повышает её верхний предел.

Кроме того, я считаю, что еще одной ценностью, которую это принесло всему сообществу, является пробуждение осознания того, что на уровне агентов, помимо крупных моделей, существует огромный потенциал для воображения.
Я недавно также заметил, что в сообществе, помимо исследователей, все больше людей начинают участвовать в变革е AGI, все больше людей знакомятся с более мощными фреймворками агентов, такими как Harness и Scaffold. Эти люди, в определенной степени, используют эти инструменты для замены части своей работы, одновременно высвобождая свое время для занятий, требующих большей фантазии.
Хуан Чжао: Я думаю, что с точки зрения модели взаимодействия, основной причиной популярности OpenClaw стало то, что он предоставил более «человеческий» опыт. Мы занимаемся агентами уже около двух лет, но такие агенты, как Cursor и Claude Code, раньше воспринимались скорее как инструменты. OpenClaw впервые интегрирован в мессенджер, что создает ощущение близости к идеальному «персональному Джарвису». Я считаю, что это прорыв в модели взаимодействия.
Еще один важный момент: это вновь подтверждает, что простые, но эффективные фреймворки, такие как Agent Loop, являются жизнеспособными. В то же время это заставляет нас переосмыслить вопрос: нам действительно нужен универсальный суперагент, способный выполнять все задачи, или же нам нужен более эффективный «маленький помощник» — что-то вроде легкой операционной системы или каркаса?
Идея OpenClaw заключается в том, чтобы с помощью такой «малой системы» или «системы для раков» и её экосистемы вдохновить людей на настоящую игру, что в свою очередь раскроет весь потенциал всех инструментов в экосистеме.
С появлением таких возможностей, как Skills и Harness, все больше людей могут создавать приложения для систем, подобных OpenClaw, и обеспечивать мощность для различных отраслей. Я считаю, что это естественным образом тесно связано со всей экосистемой с открытым исходным кодом. На мой взгляд, эти два момента стали для нас наибольшим вдохновением.
03. GLM Новая модель создана специально для "работы", повышение цены — это возвращение к нормальной коммерческой ценности
Ян Чжилинь: Хотел бы задать вопрос Чжан Пэну. Недавно я увидел, что Zhipu выпустила новую модель GLM-5 Turbo, и я понимаю, что в ней значительно улучшены возможности агентов. Не могли бы вы рассказать, в чем основные отличия этой новой модели от других? Кроме того, мы заметили повышение цен — какие рыночные сигналы это отражает?
Чжан Пэн: Это отличный вопрос. Два дня назад мы действительно провели срочное обновление, что на самом деле является одним из этапов нашего общего дорожного плана, просто мы提前 вывели его наружу.
Основная цель — перейти от прежнего «простого диалога» к «настоящей работе» — именно это все недавно ощутили: большие модели больше не просто могут общаться, а действительно помогают людям работать.
Но за «выполнением задач» скрывается очень высокий уровень требований к способностям. Модель должна самостоятельно планировать долгосрочные задачи, постоянно экспериментировать и корректировать ошибки, сжимать контекст, отлаживать код и, возможно, обрабатывать мультимодальную информацию. Поэтому требования к способностям модели здесь существенно отличаются от традиционных универсальных моделей, ориентированных на диалог. GLM-5 Turbo был специально улучшен в этих аспектах, особенно в том, что вы упомянули — заставить модель работать и выполнять задачи в течение 72 часов, чтобы она могла беспрерывно циклически выполнять операции. Мы проделали огромную работу в этой области.
Кроме того, пользователи также активно интересуются вопросом расхода токенов. Выполнение сложных задач с помощью мощной модели требует огромного количества токенов. Обычные пользователи могут этого не замечать, но при просмотре счета замечают, как быстро уходят деньги. Поэтому мы также провели оптимизацию в этой области: при выполнении сложных задач модель теперь использует более эффективный расход токенов. В целом архитектура модели остается универсальной архитектурой с совместной обработкой нескольких задач, но мы усилили ее способности в определенных направлениях.
На самом деле, повышение цен тоже легко объяснить. Ранее говорилось, что сейчас уже не просто задаешь вопрос и получаешь ответ — цепочка рассуждений за этим очень длинная. Многие задачи требуют взаимодействия с написанием кода и базовой инфраструктурой, а также постоянной отладки и исправления ошибок, что потребляет огромное количество ресурсов. Количество токенов, необходимое для выполнения сложной задачи, может быть в десять или даже сто раз больше, чем для ответа на простой вопрос.
Таким образом, цена должна быть повышена, модель стала больше, и стоимость вывода соответственно возросла. Мы возвращаемся к нормальной коммерческой ценности, поскольку длительная конкуренция по низким ценам не способствует развитию всей отрасли. Это также позволяет нам создать благоприятный замкнутый цикл коммерциализации, постоянно совершенствовать возможности модели и предоставлять пользователям лучший сервис.
04. Создание более эффективного токен-фабрики: сама инфраструктура также должна быть агентом
Ян Чжилинь: Сейчас открытые модели становятся все более многочисленными и начинают формировать экосистему, при этом различные модели могут предоставлять пользователям больше ценности на разных вычислительных платформах. С ростом объема использования токенов большие модели переходят от эпохи обучения к эпохе вывода. Хотел бы спросить Ли Сюэ: с точки зрения инфраструктуры, что означает эпоха вывода для Увэнь?
Ся Лисюэ: Мы — инфраструктурная компания, рождённая в эпоху ИИ, и сейчас мы поддерживаем Zhipu, Kimi, Mimo и другие, помогая пользователям более эффективно использовать фабрики токенов. Мы также сотрудничаем со многими университетами и научно-исследовательскими институтами.
Поэтому мы постоянно размышляем над одним вопросом: какая инфраструктура необходима для эпохи AGI? И как мы можем поэтапно реализовать и смоделировать её. Мы уже полностью подготовились к решению задач, стоящих на краткосрочном, среднесрочном и долгосрочном этапах.
Сейчас самый прямой вопрос — это то, о чём все только что говорили: резкий рост объёма токенов, связанных с Open, создал более высокие требования к оптимизации эффективности системы. Включая корректировку цен, это также является способом реагирования на эту потребность.
Мы всегда подходили к решению этих задач через интеграцию программного и аппаратного обеспечения. Например, мы подключили практически все типы вычислительных чипов, объединив более десяти различных чипов и десятки различных кластеров вычислительной мощности в единую систему. Это позволяет решить проблему нехватки вычислительных ресурсов в AI-системах: когда ресурсов недостаточно, лучший способ — задействовать все доступные ресурсы и направить каждый из них на наиболее эффективное применение, чтобы достичь максимальной трансформационной эффективности.
На этом этапе наша задача — создать более эффективный токен-фабрику. Мы провели множество оптимизаций, включая наилучшую адаптацию модели и аппаратных ресурсов, таких как видеопамять, а также исследуем, могут ли новые архитектуры моделей и аппаратного обеспечения породить более глубокую синергию. Однако решение текущих проблем с эффективностью — это лишь создание стандартизированной токен-фабрики.

В эпоху агентов мы считаем, что этого недостаточно. Поскольку агенты больше похожи на людей, им можно поручить задачу. Я твердо убежден, что большинство инфраструктуры эпохи облачных вычислений были созданы для обслуживания программ и инженеров-людей, а не для ИИ. Это эквивалентно созданию инфраструктуры с интерфейсом для людей, а затем добавлению слоя для подключения агентов — такой подход фактически ограничивает потенциал агентов возможностями человеческого взаимодействия.
Например, агент может мыслить и запускать задачи на уровне миллисекунд, но такие базовые системы, как K8s (Kubernetes), на самом деле не готовы к этому, поскольку люди обычно запускают задачи на уровне минут. Поэтому нам нужны более продвинутые возможности, которые мы называем «Agentic Infra» — «умная фабрика токенов». Именно этим занимается Wuwen Xinqiong.
С точки зрения долгосрочной перспективы, когда наступит настоящая эра AGI, мы считаем, что даже сама инфраструктура должна быть агентом. Созданная нами фабрика также должна быть способна к самоэволюции и самообновлению, формируя автономную организацию. Она будет подобна CEO, который сам является агентом — возможно, OpenClaw — и управляет всей инфраструктурой, самостоятельно формулируя требования и обновляя её в соответствии с потребностями AI-клиентов. Только так AI может эффективно взаимодействовать с AI. Мы также проводим исследования, например, в области улучшения коммуникации между агентами и реализации возможностей типа Cache to Cache.
Поэтому мы всегда думали, что развитие инфраструктуры и ИИ не должно быть изолированным процессом — я получаю запрос и просто его реализую, — а должно вызывать богатую химическую реакцию. Именно это и есть настоящее программно-аппаратное взаимодействие, синергия алгоритмов и инфраструктуры, миссия, которую NoWenXiong стремится реализовать. Спасибо.
05. Инновации, предполагающие компромисс ради эффективности, также имеют значение — DeepSeek вдохновляет и придает уверенность отечественным командам.
Ян Чжилин: Далее хочу задать вопрос Фули. В последнее время Xiaomi внесла большой вклад в сообщество, выпустив новые модели и открыв исходный код соответствующих технологий. Хотел бы спросить вас: какие, по вашему мнению, уникальные преимущества у Xiaomi в разработке крупных моделей?
Ло Фули: Я думаю, можно暂时放下话题 о том, какие уникальные преимущества у Xiaomi, и я бы хотела поговорить о общих преимуществах китайских команд, занимающихся разработкой крупных моделей. Мне кажется, эта тема имеет более широкую ценность.
Примерно два года назад китайские команды, работающие над базовыми моделями, уже достигли значительных прорывов — мы нашли способы преодолеть ограничения низкопроизводительных вычислительных ресурсов, особенно при ограниченной пропускной способности интерфейсов NVLink, внедряя инновации в архитектуру моделей, которые на первый взгляд кажутся компромиссом ради эффективности, такие как DeepSeek V2, V3 и MoE, MLA и другие.
Но позже мы увидели, что эти инновации вызвали变革: как достичь максимального уровня интеллекта при фиксированной вычислительной мощности. Именно это дало DeepSeek смелость и уверенность всем командам, работающим над базовыми моделями в Китае. Хотя сегодня наши отечественные чипы, особенно чипы для вывода и чипы для обучения, уже не ограничены таким образом, именно эти ограничения стимулировали новые исследования в области структур моделей с целью повышения эффективности обучения и снижения стоимости вывода.
Такие архитектуры, как недавно появившиеся Hybrid Sparse и Linear Attention, например, NSA от DeepSeek и KSA от Kimi, а также HySparse от Xiaomi, представляют собой инновации в архитектуре моделей, направленные на эпоху агентов и отличающиеся от архитектур поколения MoE.
Почему я считаю структурные инновации настолько важными? На самом деле, если вы действительно начнете использовать OpenClaw, вы поймете, что он становится все удобнее и умнее с каждым использованием. Одним из условий является длина контекста для вывода. Длинный контекст — это тема, которую мы обсуждали долго, но существуют ли сейчас действительно модели, которые отлично справляются с длинным контекстом, обладают высокой производительностью и низкой стоимостью вывода?
На самом деле многие модели способны обрабатывать контекст длиной 1M или 10M, но стоимость и скорость вывода при таком контексте слишком высоки. Только снизив стоимость и повысив скорость, можно поручить моделям задачи с действительно высокой производительной ценностью, выполнять более сложные задачи в условиях длинного контекста и даже реализовать саморазвитие моделей.
Так называемая самоитерация модели означает, что она может достигать самоэволюции в сложной среде, опираясь на сверхдлинный контекст. Эта эволюция может касаться самого фреймворка агента или же самих параметров модели — поскольку я считаю, что сам контекст является формой эволюции параметров. Поэтому вопрос о том, как реализовать архитектуру с длинным контекстом и как обеспечить эффективный вывод с длинным контекстом на стороне вывода, представляет собой всестороннюю конкуренцию.
Помимо предварительного обучения с архитектурой, эффективно работающей с длинными контекстами — это проблема, которую мы начали изучать примерно год назад. Сейчас мы внедряем инновационную парадигму на этапе пост-обучения, чтобы достичь стабильности и высокого потенциала в задачах с длинными последовательностями.
Мы работаем над созданием более эффективных алгоритмов обучения, сбором текстов с настоящими долгосрочными зависимостями в контекстах 1M, 10M, 100M, а также интеграцией траекторных данных, генерируемых в сложных средах. Это то, чем мы занимаемся на этапе пост-обучения.
Но в более долгосрочной перспективе, благодаря стремительному прогрессу самих больших моделей и поддержке фреймворков Agent, как отметила Ли Сюэ, спрос на вычисления за последнее время вырос почти в десять раз. Неужели рост объема использования токенов за этот год достигнет 100 раз?
Здесь вступает в игру еще один измерение конкуренции — вычислительная мощность, или инференс-чипы, а даже дальше — энергия. Поэтому я считаю, что если все вместе подумаем над этой проблемой, я, возможно, узнаю от вас еще больше. Спасибо.
06.Agent имеет три ключевых модуля, взрывной рост многоагентных систем вызовет сдвиг
Ян Чжилинь: Очень проницательный доклад. Далее хотел бы задать вопрос Хуан Чжао: вы разрабатывали такие влиятельные проекты агентов, как Nanobot, и у вас много фанатов в сообществе. С точки зрения инструментов или применения агентов, какие технические направления, по вашему мнению, будут наиболее важными и заслуживают внимания?
Хуан Чжао: Я считаю, что если абстрагировать технологию агента, ключевыми модулями будут Planning, Memory и Tool Use.

Сначала поговорим о планировании. Сейчас основная проблема заключается в длинных задачах или очень сложных контекстах, например, с 500 шагами или более, где многие модели не могут эффективно планировать. Я считаю, что по сути модели могут не обладать подобными скрытыми знаниями, особенно в сложных вертикальных областях. Поэтому в будущем, возможно, потребуется закрепить знания о различных сложных задачах непосредственно в моделях — это может быть одним из направлений.
Конечно, Skill и Harness также частично смягчают ошибки, вызванные Planning, поскольку предоставляют качественные Skill, что по сути помогает модели выполнять более сложные задачи.
Еще раз о Memory. Впечатление от Memory состоит в том, что он постоянно сталкивается с проблемами неточного сжатия информации и некорректного поиска. Особенно в длинных задачах и сложных сценариях нагрузка на Memory резко возрастает. Сейчас проекты, такие как OpenClaw, используют самый простой формат Memory — файловую систему на основе Markdown, реализуемую через общий файл. В будущем Memory, вероятно, перейдет к иерархической архитектуре и должен стать более универсальным.
Честно говоря, текущая механика Memory трудно сделать универсальной — потому что сценарии кодирования, глубокого исследования и мультимодальные сценарии сильно различаются по типам данных; как эффективно осуществлять поиск и индексацию этих Memory — это всегда компромисс.
Кроме того, теперь, после того как OpenClaw значительно снизил барьеры для создания агентов, в будущем может появиться не только один «рак». Я заметил, что Kimi также разработала механизм Agent Swarm — в будущем у каждого может быть «группа раков».
Сравнение с отдельным раком, контекст, создаваемый группой раков, можно представить как значительное увеличение, что создает огромную нагрузку на память. На данный момент не существует эффективной системы управления контекстом, порождаемым «группой раков», особенно в сценариях, связанных со сложным программированием или научными открытиями — как модель, так и вся архитектура агента испытывают огромную нагрузку.
Еще раз о использовании инструментов, то есть навыках. Проблемы, с которыми сейчас сталкиваются навыки, аналогичны тем, что были у MCP в свое время — MCP тогда страдал от отсутствия гарантий качества и рисков безопасности. Сейчас то же самое с навыками: хотя их кажется много, высококачественных мало, а низкокачественные навыки снижают точность выполнения задач агентами. Кроме того, существует проблема злонамеренного внедрения. Таким образом, с точки зрения использования инструментов, возможно, для улучшения всей экосистемы навыков необходимо полагаться на сообщество, и даже позволить навыкам самоэволюционироваться и создавать новые навыки в процессе выполнения.
В целом, от Planning и Memory до использования инструментов — это текущие болевые точки агентов, а также потенциальные направления развития.
07. Ключевые слова на следующие 12 месяцев: экосистема, устойчивые токены, самоэволюция и вычислительная мощность
Ян Чжилинь: Можно заметить, что оба гостя обсудили общую проблему с разных точек зрения — с ростом сложности задач контекст резко увеличивается. С точки зрения модели можно увеличить исходную длину контекста, а с точки зрения агентной платформы механизмы, такие как планирование, память и мультиагентные системы, также могут поддерживать более сложные задачи при определенных возможностях модели. Я считаю, что эти два направления в ближайшем будущем дадут еще больше синергии и将进一步 повысят способность выполнять задачи.
Наконец, давайте рассмотрим открытый прогноз. Пожалуйста, используйте одно слово, чтобы описать тенденцию развития крупных моделей в следующие 12 месяцев и ваши ожидания. Сейчас начнём с Хуан Чжао.
Хуан Чжао: 12 месяцев в области ИИ кажутся очень далекими — невозможно предсказать, какими они будут через 12 месяцев.
Ян Чжилинь: Здесь изначально было написано пять лет, я это изменил.
Хуан Чжао: Да, ха-ха. Одно слово, которое приходит мне на ум — «экосистема». Сейчас OpenClaw очень активно вовлекает людей, но в будущем агенты должны действительно стать «работниками», а не просто чем-то, чем люди развлекаются ради нового опыта. В будущем их следует действительно укоренить как инструмент для выполнения рутинных задач и как настоящих коллег.
Это требует усилий всего экосистемы, особенно открытого исходного кода: после того как технологии и модели будут открыты, всем сообществу необходимо совместно развивать их — будь то итерации моделей, платформы Skill или различные инструменты, — чтобы лучше создавать экосистему для крабов.
Одна из очевидных тенденций: будет ли будущее программное обеспечение всё ещё предназначено для людей? Я уверен, что в будущем много программного обеспечения может быть не ориентировано на людей — ведь людям нужен GUI, а в будущем оно может быть нативно ориентировано на агентов. Интересно, что люди будут использовать только те GUI, которые доставляют им удовольствие. В настоящее время вся экосистема переходит от GUI и MCP к модели CLI. Это требует, чтобы экосистема превратила программные системы, данные и различные технологии в нативно агентоориентированные формы, чтобы развитие стало ещё более богатым.
Ло Фули: Сократить вопрос до одного года — это очень важно. Если брать пять лет, то с моей точки зрения определения AGI, он уже достигнут. Поэтому, если описать ключевое событие в развитии AGI за следующий год одной фразой, я считаю, что это «саморазвитие».
Это слово звучит немного мистически, и его неоднократно упоминали за последний год. Но недавно я глубже осознал это — или, скорее, разработал более практичный и осуществимый подход к «самоэволюции». Причина в том, что после появления мощных моделей мы совершенно не раскрыли потенциал предварительно обученных моделей в рамках чат-парадигмы, а фреймворк агентов активировал этот потенциал. Когда мы заставляем модель выполнять более длительные задачи, мы обнаруживаем, что она способна самостоятельно учиться и эволюционировать.
Простой эксперимент: добавьте к существующей архитектуре агента проверяемое условие ограничения и запустите цикл, заставив модель постоянно итеративно оптимизировать цель — вы увидите, что она способна постоянно предлагать всё более качественные решения. Такая саморазвивающаяся система сейчас уже может работать в течение одного-двух дней, хотя это зависит от сложности задачи.
Например, в некоторых научных исследованиях, таких как поиск более эффективных архитектур моделей, где существуют критерии оценки, например, более низкий PPL, мы обнаружили, что он уже может самостоятельно оптимизировать и выполнять задачи в течение двух-трех дней.
Так что с моей точки зрения, самоэволюция — это единственное место, где можно «создавать что-то новое». Она не заменяет существующую производительность людей, а, подобно ведущим ученым, исследует то, чего еще нет в мире. Год назад я думал, что этот временной горизонт составит три-пять лет, но недавно я пришел к выводу, что его следует сократить до одного-двух лет. Возможно, очень скоро мы сможем объединить крупные модели с мощной рамкой самоэволюционирующего агента, чтобы достичь по крайней мере экспоненциального ускорения научных исследований.
Недавно я обнаружил, что у наших коллег из группы, занимающихся исследованиями крупных моделей, рабочие процессы являются высоконестабильными и высококреативными, но благодаря Claude Code и передовым моделям наша исследовательская эффективность выросла почти в десять раз. Я с нетерпением жду, что эта парадигма распространится на более широкие дисциплины и области, поэтому я считаю, что «самоэволюция» крайне важна.
Ся Лисюэ: Мой ключевой термин — «устойчивый токен». Я вижу, что развитие ИИ всё ещё находится в долгосрочном процессе, и мы也希望, чтобы оно имело долгую жизнь. С точки зрения инфраструктуры, большая проблема заключается в том, что ресурсы в конечном счёте ограничены.
Как и в случае с устойчивым развитием в прошлом, для нас, как фабрики токенов, важнейшей проблемой является способность постоянно, стабильно и масштабно предоставлять токены, чтобы передовые модели могли действительно служить большему количеству нижестоящих сервисов.
Нам нужно расширить взгляд на всю экосистему — от энергии и вычислительной мощности до токенов и, в конечном итоге, приложений, чтобы создать устойчивую экономически обусловленную итерацию. Мы не только будем использовать все внутренние вычислительные мощности, но и экспортировать эти возможности за рубеж, чтобы объединить и интегрировать глобальные ресурсы.
Я тоже считаю, что «устойчивость» на самом деле означает создание китайской модели токеномики. Раньше мы говорили о «сделано в Китае», превращая низкую производственную мощность Китая в качественные товары, экспортируемые по всему миру.
Сейчас мы должны сделать «ИИ, сделанный в Китае» — устойчиво превращать преимущества Китая в области энергии и других сферах в качественные токены через фабрику токенов, экспортируя их по всему миру и становясь мировой фабрикой токенов. Это то, чего я хочу увидеть в этом году — ценность, которую Китай приносит миру через искусственный интеллект.
Чжан Пэн: Я буду краток. Все смотрят на звезды, а я вернусь к реальности. Мой ключевой термин — «вычислительная мощность».
Как уже говорилось ранее, все технологии и агентные фреймворки повысили вашу креативность и эффективность в десять раз, но при условии, что вы действительно сможете ими пользоваться. Нельзя задавать вопрос и ждать, пока он долго думает, не давая ответа — это совершенно неприемлемо. Именно поэтому многие исследования и задуманные проекты сталкиваются с препятствиями.
Два года назад я помню, как один академик на форуме Чжунцзяньцзянь сказал: «Без карт — без эмоций, говорить о картах — обидно». Мне кажется, сегодня мы снова находимся на этом этапе, но ситуация другая. Сейчас мы вошли в фазу вывода, и спрос действительно взрывается — растет в десять, сто раз. Только что вы сказали, что объем использования вырос в десять раз, но, возможно, реальный спрос увеличился в сто раз? И существует огромное количество неудовлетворенного спроса — что делать? Давайте все вместе подумаем над решением.
