Експерти обговорюють вплив OpenClaw на AI-агенти та виклики у сфері обчислень

Автор: Чень Цзюньда

За матеріалами Zhixidong 27 березня: сьогодні на форумі Чжунцзяньцань генеральний директор Zhipu Zhang Peng, генеральний директор Moonshot AI Ян Чжилінь (який виступав у ролі модератора), керівник великої моделі MiMo в Xiaomi Luo Fuli, генеральний директор Wuwen Xinqiong Xia Lixue та доцент Гонконзького університету Хуан Чжао рідкісно зустрілися разом, щоб провести глибоку дискусію про майбутнє відкритих великих моделей та агентів.

Цей діалог розпочався з найпопулярнішої наразі OpenClaw, і всі гості згодні, що агенти дозволяють великим моделям справді «почати працювати». OpenClaw розширює межі можливостей великих моделей, але й висуває до них більш високі вимоги. Zhipu досліджує такі можливості, як довгострокове планування та самодіагностика, тоді як команда Ло Фулі зосереджена на зменшенні витрат та підвищенні швидкості завдяки інноваціям в архітектурі, навіть досягаючи самоеволюції моделі.

Інфраструктура також повинна крокувати разом із агентами. Ся Лісюе вважає, що сучасні системи обчислювальної потужності та програмна архітектура все ще створені для людей, а не для агентів, і саме здатність людини до операцій обмежує простір для розвитку агентів. Тому нам потрібно створити Agentic Infra.

За поглядом кількох гостей, відкрите програмне забезпечення є одним із ключових драйверів розвитку великих моделей та агентів. Допоміжний професор Університету Гонконгу Хуан Чжао вважає, що процвітання екосистеми відкритого коду є ключовим для переходу агентів від «просто для розваги» до справжнього «робітника». Лише завдяки спільнотній співпраці можна повністю перетворити програмне забезпечення, дані та технології на агентно-орієнтовану форму, що призведе до створення сталого глобального штучного інтелекту.

Крім того, кілька гостей обговорили такі теми, як підвищення цін на великі моделі, вибуховий ріст використання токенів та ключові слова для майбутнього ШІ протягом наступних 12 місяців. Ось основні ідеї цього панельного обговорення:

1. Чжан Пэн: Після збільшення розміру моделі витрати на виведення також зростають. Недавня політика підвищення цін від Zhipu насправді повертається до нормальної комерційної вартості; довгострокова конкуренція за низькими цінами шкодить розвитку галузі.

2. Чжан Пэн: Вибух нових технологій, таких як агенти, призвів до зростання використання токенів у 10 разів, але реальний попит може зростати у 100 разів, і величезний попит залишається незадоволеним, тому обчислювальні потужності залишаються ключовою проблемою на наступні 12 місяців.

3. Ло Фулі: З погляду виробників базових великих моделей, OpenClaw забезпечує мінімальний рівень базових великих моделей та піднімає верхню межу. Ступінь виконання завдань для китайських відкритих моделей + OpenClaw вже дуже близький до Claude.

4. Ло Фулі: DeepSeek надав китайським виробникам великих моделей мужність і впевненість. Деякі інновації в архітектурі моделей, які здавалися «компромісом для ефективності», спричинили справжні зміни, дозволивши галузі досягти найвищого рівня інтелекту при обмежених обчислювальних ресурсах.

5. Ло Фулі: Найважливішим у майбутньому році для шляху AGI буде «саморозвиток». Саморозвиток дозволяє великим моделям досліджувати, як топові вчені, і є єдиним місцем, де можна «створювати нове». Xiaomi вже за допомогою Claude Code+ топових моделей збільшила ефективність досліджень у 10 разів.

6. Ся Лісюе: Коли настане ера AGI, інфраструктура сама повинна бути агентом, автономно керувати всією інфраструктурою та ітерувати її згідно з потребами AI-клієнтів, досягаючи самоеволюції та самоітерації.

7. Ся Лісюе: OpenClaw спричинив вибух використання токенів. Поточна швидкість споживання токенів нагадує відчуття початку 3G, коли щомісяця було лише 100 МБ трафіку.

8. Хуан Чжао: У майбутньому багато програмного забезпечення не буде призначене для людей; програмне забезпечення, дані та технології будуть розроблені у формі Agent-Native, і людям у майбутньому, можливо, доведеться використовувати лише ті «GUI, які роблять їх щасливими».

Ось повний транскрипт цього круглого столу:

01. OpenClaw — це просто «скелет», витрати токенів великих моделей все ще на рівні ери 3G

Ян Чжилінь: Ми дуже раді, що сьогодні змогли запросити таких видатних гостей — кілька гостей походять з рівнів моделей, обчислювальних ресурсів та агентів. Найголовнішими ключовими словами сьогодні є відкрите програмне забезпечення та агенти.

Перше питання — поговоримо про зараз найпопулярніший OpenClaw. Які аспекти використання OpenClaw або подібних продуктів у повсякденному житті ви вважаєте найбільш інноваційними або найбільш запам’ятовуваними? Як з технічної точки зору ви оцінюєте еволюцію OpenClaw та пов’язаних агентів сьогодні?

Чжан Пэн: Я почав грати в OpenClaw ще тоді, коли він називався Clawbot. Я сам розбирався з цим, адже я програміст, і у мене були власні враження від цього.

На мою думку, найбільший прорив і новизна, які OpenClaw принесла всім, полягає в тому, що вона більше не є виключною привілеєю програмістів чи гіків. Звичайні люди також можуть досить легко використовувати потужності передових моделей, особливо в сфері програмування та агентів.

Тоже до цього моменту, під час спілкування з вами, я більше схильний називати OpenClaw «скелетом». Він надає можливість створити дуже міцну, зручну, але водночас гнучку конструкцію на основі моделей. Ви можете використовувати різноманітні нові функції, що надаються нижчими рівнями моделей, згідно зі своїми бажаннями.

Раніше власні ідеї могли обмежуватися відсутністю навичок програмування або інших пов’язаних навичок, але сьогодні, завдяки OpenClaw, я зміг виконати це за допомогою дуже простого спілкування.

OpenClaw надав мені дуже великий вплив, або, можливо, дозволив мені заново зрозуміти це.

Ся Лісюе: Насправді, коли я вперше використовувала OpenClaw, мені було важко звикнути, бо я звикла до спілкування з великими моделями, і після використання мені здалося, що OpenClaw дуже повільно відповідає.

Але потім я усвідомив одну проблему: воно сильно відрізняється від попередніх чат-ботів, бо є сутністю, що може допомогти мені виконати велику задачу. Коли я почав надсилати йому більш складні завдання, я зрозумів, що воно дуже добре їх виконує.

Ця річ надала мені велике враження. Модель спочатку спілкувалася за допомогою токенів, а зараз перетворилася на агента, на рака, який може допомогти вам виконати завдання. Це значно розширює загальну уяву щодо штучного інтелекту.

В той же час, це також вимагає високих вимог до здатності всієї системи. Ось чому, коли я вперше використовував OpenClaw, мені здавалося, що він трохи підвисає. Як виробник інфраструктурного рівня, я бачу, що OpenClaw приносить більше можливостей і викликів для великих систем і екосистеми, що стоять за штучним інтелектом.

Наші поточні ресурси недостатні, щоб підтримати такий швидкий рост. Наприклад, щодо нашої компанії: з кінця січня наші витрати на токени подвоювалися майже кожні два тижні, і зараз вони зросли майже в 10 разів.

Востаннє я бачив таку швидкість, коли використовував 3G-телефон і витрачав трафік. У мене виникає відчуття, що теперішній витрати токенів нагадують ті часи, коли щомісяця було лише 100 МБ мобільного трафіку.

У такій ситуації нам потрібно краще оптимізувати та інтегрувати всі наші ресурси, щоб кожна людина — не лише в галузі ШІ, а в усьому суспільстві — могла використовувати можливості ШІ OpenClaw.

Як гравець у сфері інфраструктури, я дуже захоплений і глибоко відчуваю цю епоху. Я також вважаю, що тут є багато можливостей для оптимізації, які ми ще повинні досліджувати та пробувати.

02. OpenClaw піднімає межі китайських моделей, значущість прориву в інтерактивному режимі

Ло Фулі: Я сама сприймаю OpenClaw як надзвичайно революційну та деструктивну подію в процесі еволюції агентських фреймворків.

Насправді всі люди, з якими я знайомий і хто займається глибоким кодуванням, на перше місце ставлять Claude Code. Але я впевнений, що користувачі OpenClaw відчувають, що багато дизайнерських рішень в його агентській системі є передовими порівняно з Claude Code. Останні оновлення Claude Code багато в чому наближаються до OpenClaw.

Коли я використовую OpenClaw, я відчуваю, що цей фреймворк дає мені можливість безперервно розширювати свою уяву будь-де. Claude Code спочатку міг розширювати мої ідеї лише на моєму настільному комп’ютері, але OpenClaw дозволяє розширювати мої ідеї будь-де і будь-коли.

Основні цінності, які приносить OpenClaw, — дві. Перша — це його відкрите джерело. Відкрите джерело дуже сприяє глибокій участи всієї спільноти, зверненню уваги та просуванню розвитку цієї рамки — це дуже важлива передумова.

Я вважаю, що велика цінність таких AI-фреймворків, як OpenClaw, полягає в тому, що вони піднімають верхню межу моделей, які в Україні мають рівень, близький до закритих моделей, але ще не досягли їхнього рівня.

У більшості сценаріїв ви помітите, що його (вітчизняна відкрита модель + OpenClaw) завершеність завдань дуже близька до останніх моделей Claude. Крім того, він добре забезпечує мінімальний рівень — завдяки системі Harness або іншим аспектам дизайну, таким як його система навичок, що гарантує повноту та точність завдань.

Підсумовуючи, з точки зору розробників виробників базових великих моделей, OpenClaw забезпечує мінімальний рівень базових великих моделей та підвищує їх потенціал.

Крім того, я вважаю, що ще одна цінність, яку вона принесла всьому співтовариству, — це те, що вона розбудила свідомість людей, змусивши їх усвідомити, що на рівні агентів, окрім великих моделей, існує величезний простір для уяви.

Я також зауважив, що в спільноті, крім дослідників, все більше людей починають брати участь у змінах, пов’язаних з AGI, і все більше людей знайомляться з більш потужними фреймворками агентів, такими як Harness і Scaffold. Ці люди частково використовують ці інструменти для заміни частини своєї роботи, одночасно звільняючи час для занять більш інтелектуальними справами.

Хуан Чжао: На мою думку, перш за все, з точки зору інтерактивного режиму, причиною популярності OpenClaw є те, що він надав досвід, який виглядає більш «живим». Ми працювали з агентами вже рік-два, але раніше такі агенти, як Cursor, Claude Code, викликали відчуття більш «інструментального» характеру. OpenClaw вперше представив ідею вбудовування у миттєві повідомлення, що створює враження ближчого до уявлення про «особистого Джарвіса». Я вважаю, що це може бути проривом у інтерактивному режимі.

Ще один момент: це надає цілій спільноті натхнення — проста, але ефективна фреймворка, як Agent Loop, знову підтверджує свою працездатність. Крім того, вона змушує нас переглянути питання: чи нам потрібен універсальний суперагент, здатний робити все, чи краще підійде «малий домогосподар», як легковажна операційна система чи каркас?

Ідея OpenClaw полягає в тому, щоб за допомогою такої «малої системи» або «ракової операційної системи» та її екосистеми надати людям справжнє почуття гри, що, в свою чергу, розблокує всі інструменти всередині екосистеми.

З появою таких здібностей, як Skills і Harness, все більше людей можуть створювати додатки для систем, подібних до OpenClaw, надаючи можливості різним галузям. Я вважаю, що це природним чином тісно пов’язано з усією відкритою екосистемою. На мою думку, саме ці два моменти є найбільшими висновками, які ми зробили.

03. GLM Нова модель створена саме для “роботи”, підвищення ціни — це повернення до нормальної комерційної вартості

Ян Чжилінь: Хотів би задати питання Чжан Пену. Недавно ми побачили, що Zhipu випустила нову модель GLM-5 Turbo, і я розумію, що вона значно посилила здатності агента. Чи не могли б ви розповісти про відмінності цієї нової моделі від інших? Крім того, ми зауважили стратегію підвищення цін — що це відображає з точки зору ринкових сигналів?

Чжан Пэн: Це дуже хороше питання. Два дні тому ми справді зробили термінове оновлення, що є частиною нашого загального розвиткового плану, просто ми випустили його раніше.

Головна мета — перейти від ранішніх «простих діалогів» до «справжньої роботи» — і саме це останнім часом відчувають усі: великі моделі більше не просто можуть спілкуватися, а й справді допомагають людям виконувати роботу.

Але за «виконанням завдань» стоїть дуже високий рівень вимог до здібностей. Модель повинна самостійно планувати довготривалі завдання, постійно експериментувати та коригувати помилки, стискати контекст, налагоджувати та, можливо, обробляти мультимодальні дані. Тому вимоги до здібностей моделі суттєво відрізняються від традиційних універсальних моделей, орієнтованих на діалог. GLM-5 Turbo був спеціально покращений саме в цих аспектах, зокрема — у тому, що ви згадали: здатність виконувати завдання протягом 72 годин безперервно, без зупинки в циклі — саме в цьому ми провели багато роботи.

Крім того, користувачі дуже стурбовані витратою токенів. Виконання складних завдань розумною моделлю вимагає величезної кількості токенів. Звичайні користувачі можуть цього не помічати, але, переглядаючи рахунки, помічають, що гроші зникають дуже швидко. Тож ми також оптимізували цей аспект: під час виконання складних завдань модель здатна використовувати більш ефективну кількість токенів. У цілому архітектура моделі залишається універсальною архітектурою з багатозадачним співпрацюванням, але ми посилили її здатності у напрямку конкретних завдань.

Підвищення ціни насправді досить легко пояснити. Раніше ми згадували, що зараз уже не можна просто задати питання й отримати відповідь — ланцюжок міркувань за цим дуже довгий. Багато завдань вимагають взаємодії з кодом та нижчою інфраструктурою, постійного виправлення помилок та налагодження, що вимагає величезних ресурсів. Кількість токенів, необхідних для виконання складного завдання, може бути в десять або навіть сто разів більшою, ніж для відповіді на просте питання.

Тому ціна має бути піднята, модель стала більшою, і відповідно зросли витрати на виведення. Ми повертаємося до нормальної комерційної цінності, оскільки довгострокова конкуренція за низькими цінами не сприяє розвитку всієї галузі. Саме це дозволяє нам створити позитивний замкнений цикл комерціалізації, постійно покращувати здатності моделі та надавати вам кращі сервіси.

04. Створення більш ефективної фабрики токенів: інфраструктура також повинна бути агентом

Ян Чжилінь: Зараз відкритих моделей стає все більше, і вони починають формувати екосистему — різні моделі можуть надавати користувачам більше цінності на різних платформах обчислювальних потужностей. Зі зростанням використання токенів великі моделі переходять від ери навчання до ери висновку. Питання до Лісюе: як це впливає на Wuwen з точки зору інфраструктури?

Ся Лісюе: Ми — інфраструктурна компанія, що виникла в епоху ШІ, і зараз надаємо підтримку Zhizhang, Kimi, Mimo та іншим, щоб користувачі могли ефективніше використовувати фабрики токенів. Крім того, ми співпрацюємо з багатьма університетами та науковими установами.

Тож ми постійно думали про одне: яка інфраструктура знадобиться в епоху AGI? І як ми можемо поступово досягти та моделювати її. Ми вже добре підготувалися до вирішення проблем, що стоять перед нами на короткостроковому, середньостроковому та довгостроковому етапах.

Зараз найбільш пряма проблема — це те, про що всі тільки що говорили: різке збільшення кількості токенів, пов’язаних з Open, вимагає більш високого рівня оптимізації системи. Включаючи коригування цін, це також є способом реагування на цю потребу.

Ми завжди підходили до цього через інтеграцію програмного та апаратного забезпечення. Наприклад, ми підключили майже всі типи обчислювальних чіпів, об’єднавши десятки різних чіпів у країні та десятки різних кластерів обчислювальної потужності в єдину мережу. Це дозволяє вирішити проблему дефіциту обчислювальних ресурсів у AI-системах: коли ресурсів недостатньо, найкращий спосіб — використати всі доступні ресурси та спрямувати кожен обчислювальний ресурс на найбільш ефективні завдання, щоб досягти максимальної продуктивності.

Отже, на цьому етапі ми вирішуємо, як створити більш ефективну фабрику токенів. Ми провели багато оптимізацій, включаючи найкращу адаптацію моделей та апаратних ресурсів, таких як пам’ять GPU, а також досліджуємо, чи можуть нові архітектури моделей та апаратних засобів спричинити глибші синергетичні ефекти. Але вирішення поточних проблем з ефективністю — це лише створення стандартизованої фабрики токенів.

Направлені на еру агентів, ми вважаємо, що цього недостатньо. Бо агенти схожі на людей — їм можна доручити завдання. Я переконаний, що більшість інфраструктури ери хмарних обчислень була розроблена для обслуговування програм та інженерів-людей, а не для штучного інтелекту. Це еквівалентно створенню інфраструктури з інтерфейсом для людей, а потім додаванню шару для підключення агентів — такий підхід фактично обмежує потенціал агентів за рахунок людських можливостей.

Наприклад, агент може мислити та запускати завдання на рівні мілісекунд, але такі базові системи, як K8s (Kubernetes), на це не розраховані, оскільки люди зазвичай запускають завдання на рівні хвилин. Тому нам потрібні більш просунуті можливості, які ми називаємо «Agentic Infra» — «розумна фабрика токенів». Саме цим займається Wuwen Xinqiong.

З більш довгострокової перспективи, коли настане справжній епоха AGI, ми вважаємо, що навіть інфраструктура повинна бути агентом. Наша фабрика також повинна бути здатною до саморозвитку та самоітерації, формуючи автономну організацію. Вона подібна до CEO, який сам є агентом — можливо, OpenClaw — що керує всією інфраструктурою, самостійно формулює вимоги та ітерує інфраструктуру залежно від потреб AI-клієнтів. Лише так AI може ефективніше взаємодіяти з AI. Ми також проводимо дослідження, наприклад, покращення комунікації між агентами та функцій типу Cache to Cache.

Тому ми завжди думали, що розвиток інфраструктури та ШІ не повинен бути ізольованим станом — я отримую вимогу і виконую її, — а повинен викликати дуже багато хімічних реакцій. Саме це є справжнім синергізмом між програмним та апаратним забезпеченням, між алгоритмами та інфраструктурою, і саме це є місією, яку завжди прагнула реалізувати Wuwen Xinqiong. Дякую.

05. Інновації, що піддають компромісу ефективність, також мають значення — DeepSeek надав китайській команді мужність і впевненість

Ян Чжилінь: Далі хочу задати питання Фулі. Недавно Xiaomi зробив великий внесок у спільноту, опублікувавши нову модель та відкривши технології на відкритий доступ. Чи можете ви розповісти, які, на вашу думку, унікальні переваги Xiaomi у розробці великих моделей?

Ло Фулі: Я вважаю, що спочатку можна відкласти тему про те, які у Xiaomi є унікальні переваги, і я б хотіла поговорити про загальні переваги китайських команд, що розробляють великі моделі. Я вважаю, що ця тема має більш широку цінність.

Приблизно два роки тому китайські команди базових моделей досягли чудових проривів — ми вирішили, як перебороти обмеження низькопродуктивних обчислювальних ресурсів, особливо при обмеженій пропускній здатності NVLink, шляхом інновацій у структурі моделей, які здаються «компромісом для ефективності», наприклад, серії DeepSeek V2, V3, MoE, MLA тощо.

Але потім ми побачили, що ці інновації спричинили зміну: як досягти найвищого рівня інтелекту за фіксованої обчислювальної потужності. Саме це надало DeepSeek впевненість і мужність всім командам базових моделей в Китаї. Хоча сьогодні наші китайські чіпи, особливо чіпи для висновків та навчання, вже не підлягають таким обмеженням, саме ці обмеження спонукали нас до нових досліджень структур моделей, спрямованих на підвищення ефективності навчання та зниження витрат на висновки.

Як і структури, що з’явилися недавно, такі як Hybrid Sparse та Linear Attention, наприклад, NSA від DeepSeek, KSA від Kimi, а також HySparse від Xiaomi — це інновації в архітектурі моделей, що відрізняються від покоління MoE і розроблені для ери Agent.

Чому я вважаю інновації в структурі настільки важливими? Насправді, якщо люди справді почнуть використовувати OpenClaw, вони помітять, що він стає все зручнішим і розумнішим з часом. Однією з передумов є довжина контексту висновку. Довгий контекст — це тема, якою ми обговорювали довго, але чи існують зараз справді моделі, які добре впораються з довгим контекстом, мають потужну продуктивність і низькі витрати на висновок?

Справді, багато моделей здатні обробляти контекст 1M або 10M, але вартість висновку для таких обсягів надто висока, а швидкість занадто низька. Лише зниження вартості та підвищення швидкості дозволять покласти на моделі справжні завдання з високою продуктивністю, виконувати більш складні завдання в межах довгого контексту та навіть досягти самоітерації моделі.

Так звана самореалізація моделі полягає в тому, що вона може в межах складного середовища досягати самоеволюції за допомогою наддовгого контексту. Ця еволюція може стосуватися самого фреймворку агента або параметрів моделі — бо я вважаю, що сам контекст є формою еволюції параметрів. Тому те, як реалізувати архітектуру з довгим контекстом та як забезпечити ефективне виведення з довгим контекстом на стороні інференсу, є всебічною боротьбою.

Крім архітектури, яка була оптимізована для ефективної роботи з довгим контекстом на етапі попереднього навчання — це питання, яке ми почали досліджувати рік тому. Зараз реальне досягнення стабільності та високого потенціалу в довготривалих завданнях — це інноваційна парадигма, яку ми зараз ітеруємо на етапі післянавчання.

Ми думаємо, як створити більш ефективні навчальні алгоритми, як збирати тексти з реальних умов, що містять справжні довгострокові залежності в контекстах 1M, 10M, 100M, а також поєднувати їх із треками, згенерованими складними середовищами. Це те, що ми зараз робимо після навчання.

Але з більш довгострокової перспективи, завдяки швидкому розвитку самих великих моделей та підтримці фреймворків Agent, як сказала Лісюе, попит на висновки за минулий період збільшився майже в десять разів. Чи зросте загальний обсяг використання токенів цього року в 100 разів?

Тут вступає в гру ще один вимір конкуренції — обчислювальна потужність, або інференс-чіпи, а навіть далі — енергія. Тож я вважаю, що якщо ми всі разом подумаємо над цим питанням, я, можливо, навчуся більшого від вас. Дякую.

06.Agent має три ключові модулі, вибух мульти-агентів призведе до потужного впливу

Ян Чжилінь: Дуже проникливе виступ. Далі хочу запитати Хуан Чжао: ви розробляли такі впливові проекти агентів, як Nanobot, і маєте багато фанатів у спільноті. Чи можете ви розповісти, які технічні напрямки, на вашу думку, є найважливішими та варто уваги з точки зору використання або застосування агентів?

Хуан Чжао: Я вважаю, що якщо абстрагувати технологію Agent, ключовими є модулі Planning, Memory та Tool Use.

Спочатку про планування. Зараз проблема полягає в тому, що у довгострокових завданнях або дуже складних контекстах, наприклад, з 500 кроками або більше, багато моделей не можуть добре планувати. На мою думку, суть у тому, що модель, можливо, не має таких прихованих знань, особливо в складних вертикальних галузях. Тому майбутнім напрямком може бути закріплення знань про різноманітні складні завдання безпосередньо в моделі.

Звичайно, Skill та Harness певним чином також зменшують помилки, пов’язані з Planning, оскільки надають якісні Skill, що суттєво допомагають моделі виконувати складніші завдання.

Ще раз про Memory. Відчуття таке, що Memory постійно стикається з проблемами неправильного стиснення інформації та неточного пошуку. Особливо в довготривалих завданнях та складних сценаріях навантаження на Memory різко зростає. Зараз такі проекти, як OpenClaw, використовують найпростіший файловий підхід — Markdown-формат Memory, що працює через спільний файл. У майбутньому Memory, ймовірно, перейде до ієрархічної архітектури і потребуватиме більш універсального підходу.

Чесно кажучи, сьогоднішній механізм Memory важко зробити універсальним — через те, що сценарії Coding, Deep Research та мультимодальні сценарії мають дуже різні модальності даних. Як правильно здійснювати пошук та індексацію цих Memory, одночасно зберігаючи ефективність — це завжди компроміс.

Крім того, тепер, коли OpenClaw значно знизив бар’єри для створення агентів, у майбутньому може з’явитися не лише один «рак». Я бачу, що Kimi також розробив механізм Agent Swarm, і в майбутньому кожен може мати «групу раків».

Порівняно з окремим раком, збільшення контексту через групу раків уявно велике, що створює величезне навантаження на пам’ять. Зараз фактично відсутні ефективні механізми для керування контекстом, що виникає від «групи раків», особливо в сценаріях, пов’язаних із складним кодуванням або науковими відкриттями — як моделі, так і вся архітектура агента піддаються величезному навантаженню.

Ще раз про використання інструментів, тобто про навички. Проблеми, які зараз існують у навичках, схожі на ті, що були у MCP — MCP тоді страждав від відсутності гарантій якості та безпеки. Зараз те саме з навичками: на перший погляд їх багато, але якісних — дуже мало, а низькоякісні навички погіршують точність виконання завдань агентом. Крім того, існує проблема зловмисного введення. Тож з точки зору використання інструментів, можливо, потрібно, щоб спільнота покращила весь екосистему навичок, навіть дозволивши навичкам самостійно еволюціонувати та створювати нові під час виконання.

Загалом, від Planning до Memory та Tool Use — це актуальні болісні точки сьогоднішніх агентів, а також можливі напрямки майбутнього.

07. Ключові слова на наступні 12 місяців: екосистема, стійкі токени, саморозвиток та обчислювальна потужність

Ян Чжилінь: Можна побачити, що обидва гості обговорили спільну проблему з різних поглядів — із зростанням складності завдань обсяг контексту різко збільшується. З боку моделі можна збільшити вихідну довжину контексту, а з боку Agent Harness — механізми, такі як Planning, Memory, Multi-Agent, також можуть підтримувати більш складні завдання за певних можливостей моделі. Я вважаю, що ці два напрямки в майбутньому спричинять більше синергії і додатково підвищать здатність виконання завдань.

Нарешті, давайте зробимо відкритий прогноз. Будь ласка, використайте одне слово, щоб описати тенденції розвитку великих моделей на наступні 12 місяців та ваші очікування. Сьогодні почнемо з Хуан Чжао.

Хуан Чжао: 12 місяців у сфері ШІ здаються дуже віддаленими — незрозуміло, як вони розвинуться через 12 місяців.

Ян Чжилінь: Спочатку тут було написано п’ять років, я це виправив.

Хуан Чжао: Так, ха-ха. Одне слово, яке мені приходить на думку — «екосистема». Зараз OpenClaw дуже активізує людей, але майбутні агенти справді мають стати «працівниками», а не просто інструментами для розваг та ефемерного захоплення. Майбутнє полягає в тому, щоб вони справді закріпилися як інструменти для роботи, як справжні колеги.

Це вимагає зусиль усього екосистеми, особливо відкритого коду: після відкриття технологічних досліджень та моделей необхідно, щоб увесь комьюніті разом будував екосистему — незалежно від ітерацій моделей, ітерацій платформи Skill чи різних інструментів, які мають краще орієнтуватися на раків.

Одна з очевидних тенденцій: чи буде майбутнє програмне забезпечення все ще призначене для людей? Я вірю, що багато програм майбутнього можуть бути не спрямовані на людей — адже людям потрібен GUI, а майбутнє може бути спрямоване на агенти. Цікаво, що люди будуть використовувати лише ті GUI, які роблять їх щасливими. Зараз уся екосистема переходить від GUI та MCP до моделі CLI. Це вимагає, щоб екосистема перетворила програмні системи, дані та різні технології на агент-орієнтовану форму, щоб розвиток став більш багатим.

Ло Фулі: Звуження питання до одного року, на мою думку, дуже значуще. Якщо брати п’ять років, то з моєї визначення AGI, я вважаю, що це вже досягнуто. Тож, якщо описати найважливішу подію в розвитку AGI за наступний рік одним реченням, я вважаю, що це «саморозвиток».

Це слово звучить трохи містично, і протягом останнього року про нього неодноразово згадували. Але я недавно краще зрозумів його суть — а саме, як реалізувати «саморозвиток» на практиці, за допомогою більш реалістичного й здійсненного підходу. Причина в тому, що після створення потужних моделей ми в рамках чат-парадигми взагалі не використовували повний потенціал передтренованих моделей, а рамки агентів активували цей потенціал. Коли ми дали моделі виконувати довготривалі завдання, виявилося, що вона може самостійно вчитися й еволюціонувати.

Простий експеримент: додайте до існуючого фреймворку агента перевіряємий умовний обмеження та встановіть цикл, щоб модель постійно ітерувала та оптимізовувала мету — і ви помітите, що вона постійно генерує кращі рішення. Така саморозвиткова здатність зараз може працювати протягом одного-двох днів, звичайно, залежно від складності завдання.

Наприклад, у деяких наукових дослідженнях, таких як пошук кращих архітектур моделей, оскільки архітектури моделей мають критерії оцінки, наприклад, нижчий PPL, ми виявили, що вона вже може самостійно оптимізувати та виконувати завдання протягом двох-трьох днів.

Отже, з моєї точки зору, саморозвиток — це єдине місце, де можна «створити щось нове». Він не замінює продуктивність наших існуючих людей, а замість цього, як найкращі вчені, досліджує те, чого ще не існує у світі. Рік тому я вважав, що цей розклад вийде на три-п’ять років, але зараз я вважаю, що його слід скоротити до одного-двох років. Можливо, дуже скоро ми зможемо додати до великих моделей потужний фреймворк саморозвиваючогося агента, щоб досягти принаймні експоненційного прискорення наукових досліджень.

Останнім часом я зрозумів, що у наших колег із групи, які займаються дослідженнями великих моделей, процеси є високо невизначеними та високо креативними, але завдяки Claude Code та передовим моделям наша дослідницька ефективність зросла майже в десять разів. Я дуже сподіваюся, що ця парадигма пошириться на більш широкі дисципліни та галузі, тому я вважаю «саморозвиток» надзвичайно важливим.

Ся Лісюе: Мій ключовий термін — «стійкий токен». Я бачу, що розвиток ШІ все ще перебуває на довгостроковому етапі, і ми також бажаємо, щоб він мав довгий термін служби. З точки зору інфраструктури, великою проблемою є те, що ресурси в кінцевому підсумку обмежені.

Як і раніше з поняттям сталого розвитку, як токен-фабрика, ми бачимо важливу проблему: чи зможемо ми стабільно, постійно та в масштабі надавати токени, щоб найкращі моделі справді могли служити більшій кількості нижчих рівнів сервісів.

Нам потрібно розширити перспективу на весь екосистемний ланцюг — від енергії до обчислювальних потужностей, далі до токенів і, нарешті, до застосунків, щоб створити сталу економічну ітерацію. Ми не лише використовуємо всі внутрішні обчислювальні ресурси, а й експортуємо ці можливості за кордон, щоб об’єднати та інтегрувати глобальні ресурси.

Я також вважаю, що «стійкість» насправді полягає у створенні китайської економіки токенів. Раніше ми говорили про «Made in China», перетворюючи китайські низькі виробничі потужності на якісні товари, які експортуються по всьому світу.

Зараз ми маємо зробити «AI Made in China» — постійно перетворювати переваги Китаю в енергетиці та інших галузях через фабрику токенів у якісні токени, які будуть експортуватися по всьому світу, ставши світовою фабрикою токенів. Це те, чого я хочу побачити цього року — цінність, яку Китай надає світу через штучний інтелект.

Чжан Пэн: Я коротко. Всі дивляться у небо, а я залишусь на землі. Мій ключовий термін — «обчислювальна потужність».

Як уже зазначалося раніше, всі технології та агентні фреймворки збільшили вашу креативність та ефективність у десять разів, але за умови, що ви зможете їх реально використовувати. Неможливо ставити питання і чекати, що вони довго думають, не надаючи відповіді — це просто неприйнятно. Саме через це багато досліджень та задуманих справ залишаються нереалізованими.

Два роки тому я пам’ятаю, що академік на форумі Чжунцяньцзянь сказав: «Без карток — без емоцій, говорити про картки — шкодити емоціям». Я вважаю, що сьогодні ми знову досягли цього рівня, але ситуація інша. Зараз ми увійшли в етап висновків, попит справді вибухнув — зростання в десять, сто разів. Тільки що ви сказали, що обсяги зросли в десять разів, але можливо, попит збільшився в сто разів? І ще багато попиту залишається незадоволеним — що робити? Давайте разом подумаємо, як це вирішити.