Дослідники Meta покращили кодуючі агенти за допомогою повторного використання коротких зведень

Ось проблема, з якою може зіткнутися будь-хто, хто коли-небудь виправляв код: ви пробуєте щось, це не вдається, ви пробуєте знову — це не вдається інакше, і до сьомої спроби ви забули, що вже відкинули. Тепер уявіть, що цей цикл відбувається всередині агента ШІ, але замість того, щоб забувати, агент тоне в тисячах токенів детальних журналів виконання з кожної попередньої спроби.

Дослідники Meta знайшли дивовижно елегантне рішення. Замість того щоб надавати кодовим агентам повну сирову історію, вони продемонстрували, що стислі, структуровані звіти про минулі спроби можуть набагато ефективніше керувати майбутніми.

Менше — це буквально більше

Основний висновок майже протилежний інтуїції в епоху, коли «більше даних» зазвичай є стандартною відповіддю. Стислий двохрядковий підсумок того, що спробував кодовий агент і чому це не вдалося, може перевершити тисячі токенів сирого журналу виконання при керуванні наступним кроком агента.

Механізм працює у двох напрямках. По-перше, він зменшує контекстний шум — аналог співвідношення сигнал/шум у штучному інтелекті. Коли контекстне вікно агента заповнюється довгими, повторюваними даними журналу, корисна інформація загублюється. Стиснення за допомогою резюмування видаляє шум і зберігає те, що дійсно має значення.

Друге, і, можливо, важливіше, це запобігає повторенню помилок. Без чіткого запису того, що пішло не так, агенти часто допускають ті самі помилки знову і знову. Структурований підсумок працює як чек-лист «не робіть цього знову», що виявляється надзвичайно цінним для ітеративного вирішення проблем.

Підхід представляє філософський зсув у тому, як дослідники розглядають покращення агентів. Замість збільшення кількості спроб або витрачання більше обчислювальних ресурсів на проблему, акцент зміщується на стиснення пам’яті та повторне використання досвіду.

Де це вписується в ширші дослідження агентів Meta

Ця робота не існує в вакуумі. Вона є частиною постійних зусиль Meta щодо розробки систем самовдосконалюваних агентів — дослідницького напрямку, який раніше у 2026 році призвів до створення таких фреймворків, як HyperAgents і Meta-Harness.

Ранішні фреймворки заклали основу для автономних AI-систем, які можуть вдосконалювати свою власну операційну логіку з часом. Проблемою, з якою вони постійно стикалися, була когнітивна навантаженість — зокрема, як запобігти перевантаженню агентів власними історичними даними під час накопичення досвіду.

Підхід до узагальнення безпосередньо вирішує цей обмежуючий фактор. Агент продовжує накопичувати досвід, але тепер він обробляє цей досвід, перетворюючи його на стислу та дієву форму, перед тим як повернути його у майбутнє прийняття рішень.

Що це означає для інвесторів та ландшафту ШІ

Зараз більшість компаній, що розробляють кодуючі агенти, покращують свої продукти шляхом масштабування. Більше обчислювальних ресурсів, більше спроб, довші вікна контексту. Все це коштує грошей. Якщо підхід Meta виявиться ефективним у більш широкому застосуванні, це вказує на шлях до кращої продуктивності, який не вимагає лінійного збільшення витрат.

Ризик, як завжди з науковими статтями, полягає в тому, що контрольовані результати не завжди переносяться на виробничі середовища. Тестування коду є більш упорядкованим, ніж реальне програмне інженерство, і якість цих двохрядкових резюме має надзвичайне значення. Погане резюме може бути гіршим, ніж жодне резюме взагалі, оскільки вводить в оману, а не надає корисну інформацію.