Звіт Anthropic: Самоудосконалення ШІ просувається, але повна автономність ще дуже далека

За даними Beating Monitoring, здатність ШІ до автономної ітерації перевищує всі очікування. Інститут Anthropic 5 червня опублікував звіт «Коли ШІ будує себе сам», у якому детально розкрив прогрес у розробці «рекурсивного самовдосконалення». Дані показують, що на травень 2026 року більше 80% коду, що було об’єднано в основний репозиторій Anthropic, було написане Claude. До запуску Claude Code у лютому 2025 року частка коду, написаного Claude, становила лише одиниці відсотків. Засновник Zhipu AI Тан Цзе 13 травня передбачив, що фінальною точкою великих моделей стане саморозвиток, і Claude вже, ймовірно, реалізував базовий цикл «написання коду, очищення даних, самонавчання». Однак Anthropic у звіті чітко зазначила, що повна рекурсивна саморозробка наступників — автономне проектування та розробка — ще не досягнута. Роль ШІ у розробничому ланцюжку перебуває на етапі переходу від локального підвищення ефективності до автономного прийняття рішень. У другому кварталі 2026 року середня кількість коду, що об’єднується одним інженером Anthropic за день, досягла восьмиразового зростання порівняно з 2024 роком. Сучасний процес розробки простий: інженери визначають цілі та проводять огляд, а Claude виконує конкретну роботу з написання та запуску. Anthropic також впровадила Claude як автоматичного рецензента коду, який виявляє баги та безпекові уразливості. Це свідчить про те, що «самооцінка», про яку згадував Тан Цзе, вже реалізована на інженерному рівні, але людський огляд залишається останнім безпечним клапаном. Надійність автономного виконання моделями довготривалих завдань також подвоюється. Час, протягом якого модель може автономно працювати без перерви, подвоюється приблизно кожні чотири місяці. У березні 2024 року Claude 3 Opus міг виконувати прості завдання лише протягом 4 хвилин. Рік потому Claude 3.7 Sonnet зміг працювати без перерви 1,5 години. До березня 2026 року Claude 4.6 Opus уже впорався з комплексними завданнями тривалістю 12 годин. Дані оціночної організації METR показують, що останній попередній варіант Claude Mythos може автономно працювати більше 16 годин — наближаючись до межі поточних інструментів оцінки. За поточними темпами до 2027 року ШІ зможе автономно вирішувати наукові завдання, які людям вимагають кілька тижнів роботи, дозволяючи компаніям перейти від «одноосібних» до «безлюдних» моделей. Щодо припущення Тан Цзе про «базовий цикл самонавчання», звіт розкриває лише локальний «масштабний експериментальний замкнений цикл». У експерименті з прискоренням навчання малих моделей Claude 4 Opus у травні 2025 року змогла прискорити код лише в 3 рази, тоді як попередній варіант Claude Mythos у квітні 2026 року досяг прискорення в 52 рази. Натомість топові дослідники-люди зазвичай досягають прискорення в 4 рази за 4–8 годин. Проте мета оптимізації та критерії успіху експерименту були визначені людьми заздалегідь. У контексті складнішого повного циклу «очищення даних, генерація синтетичних даних та самонавчання» ШІ все ще не має необхідних здатностей до прийняття рішень. Однак автономний замкнений цикл розробки наближає людину до втрати остаточного контролю над системою. Передбачення Тан Цзе про те, що «LLM OS замінить традиційну архітектуру, а застосунки будуть генеруватися миттєво за потребою», означає, що майбутнє комп’ютерне середовище буде працювати на динамічному коді, який неможливо перевірити заздалегідь; а попередження Anthropic про те, що «людський огляд не встигає за автономним розвитком ШІ», означає, що ми навіть не можемо контролювати джерело генерації коду. Коли ШІ почне автономно проектувати та навчати своїх наступників, еволюція програмного забезпечення повністю перетвориться на чорну скриньку. Якщо в чорній скриньці дозволити ШІ проводити автономну ітерацію без людського аудиту, подальша безпекова ізоляція, моніторинг та вирównування поведінки систем самовдосконалення стануть надзвичайно складними.