Anthropic стверджує, що шлях самовдосконалення ШІ стає зрозумілим, що викликає дискусію про історію про IPO

Автор: Літера AI

Anthropic вчора опублікувала довгу статтю під назвою «When AI builds itself» (Коли AI буде себе), що звучить як одна з науково-фантастичних книг Азімова, а тема дійсно є дуже науково-фантастичною: рекурсивне самовдосконалення.

Клауд

Просто кажучи, раніше людські дослідники писали код, проводили експерименти та навчали моделі, щоб зробити ШІ сильнішим. Але якщо ШІ сам почне брати участь у проектуванні, навчанні, тестуванні та оптимізації своїх наступних версій, то швидкість прогресу ШІ більше не буде залежати лише від людини — вона може почати визначатися «саморозвитком» ШІ.

Для цього Anthropic звертається з закликом:

Ми вважаємо, що якби світ міг вибрати сповільнення або тимчасову зупинку розробки передових ШІ, щоб соціальні структури та дослідження узгодженості наздогнали технологічний прогрес, це було б великою користю для світу.

Це звучить як попередження про безпеку, але в контексті підготовки Anthropic до IPO важко не сприймати це як іншу проповідь: Claude настільки зручний, що почав створювати наступне покоління Claude.

З’явилася нова буря

Щоб проілюструвати, що ШІ все більше участвує у розробці самого ШІ, Anthropic представив великий обсяг внутрішніх даних.

Наприклад, станом на травень 2026 року понад 80% коду, що було об’єднано до кодового базу Anthropic, було написано Claude. До випуску Claude Code цей показник був лише одноцифровим.

За даними Anthropic, до другого кварталу 2026 року обсяг коду, що щодня об’єднується інженерами, збільшився приблизно в 8 разів порівняно з 2024 роком.

Клауд

Більш важливим, ніж обсяг коду, є те, що Claude працює над більш відкритими інженерними завданнями.

Anthropic зазначає, що протягом останнього року частота, з якою співробітники виправляли Claude, повертали його на правильний шлях або брали завдання на себе напівшляху, постійно зменшувалася. Ця зміна відбувається не лише у простих завданнях, а й у найскладніших відкритих завданнях.

Так звані відкриті завдання — це проблеми без чіткої інструкції. Наприклад, система впала, завдання навчання зупинилося — інженери спочатку не знають, як виглядає рішення, і повинні виявляти та аналізувати проблему поступово.

Раніше такі завдання найбільше залежали від людського досвіду, а в найвідкритіших завданнях успішність Claude до травня 2026 року досягла 76%, збільшившись на 50 процентних пунктів за шість місяців.

Клауд

Крім написання коду, Anthropic використовує Claude для перевірки коду, виявляючи баги, безпекові вразливості та інші недоліки. Після аналізу вони виявили, що якби кожна зміна коду раніше проходила автоматичну перевірку Claude, близько третини багів, що призвели до аварій на claude.ai, можна було б зупинити ще до запуску.

Ще далі, Claude вже бере участь у дослідницькому процесі.

У Anthropic є фіксований тест: надати Claude код для навчання невеликої моделі та змусити його прискорити виконання коду, не змінюючи результатів. У травні 2025 року Claude Opus 4 міг досягти прискорення приблизно в 3 рази; до квітня 2026 року Claude Mythos Preview підняв цей показник до приблизно 52 разів.

Anthropic також згадала випадок відкритих досліджень безпеки ШІ. Вони поставили перед агентом, що працює на Claude, питання: чи може слабший модуль надійно контролювати сильніший модуль?

Цей процес вимагає формулювання припущень, тестування припущень та обміну відкриттями з паралельними агентами з повторними ітераціями.

Два людських дослідники протягом тижня скоротили розрив приблизно на 23%; тоді як Claude, витративши загалом близько 800 годин і приблизно 18 000 доларів США на обчислювальні ресурси, скоротив його на 97%.

Звичайно, цей результат має обмеження: проблеми були вибрані людьми, критерії оцінки встановлені людьми, і результати не були повністю перенесені на моделі виробничого масштабу. Але він все ж свідчить про те, що Claude вже може самостійно проектувати експерименти, виконувати їх та ітерувати в межах дослідницького каркасу, який був визначений людиною.

Крім того, коли людські дослідники роблять помилку, Claude може запропонувати краще наступне рішення.

Anthropic відібрала 129 внутрішніх сесій дослідження Claude Code, у яких людські дослідники разом із Claude вирішували відкриті дослідницькі питання. Anthropic виділила деякі з цих точок, де пізніше виявилося, що люди вибрали неоптимальний шлях, і надала контекст до цієї точки різним версіям Claude, щоб побачити, який крок запропонує модель. Потім інший Claude — суддя, який знає повний результат сесії — оцінював: чи кращим було пропонування моделі чи вибір, зроблений людиною.

Результати показують, що Claude все краще пропонує наступні кроки у вузлах, де людські дослідники вже були виявлені як мають простір для покращення.

Клауд

Раніше прогрес у розробці моделей ШІ здійснювався завдяки людським дослідникам та інженерам. Люди визначали, які експерименти проводити, писали код, навчали моделі та забезпечували ітераційний розвиток функцій ШІ.

Зараз все більше ланок у цьому ланцюжку починають брати на себе Claude.

Anthropic надав дуже наочну таблицю етапів:

Клауд

З 2021 по 2023 рік Anthropic не відрізнялася від звичайних технологічних компаній — люди писали код і документи на ноутбуках.

З 2023 по 2025 рік чат-боти почали входити у робочі процеси. Інженери застосовували моделі для генерації фрагментів коду, а потім копіювали їх у редактор.

У 2025–2026 роках з’явилися програмні агенти, Claude почав самостійно писати та змінювати код, іноді навіть повністю завершувати цілі файли.

На сьогодні агенти можуть виконувати код самостійно та делегувати тривалі роботи, що тривають годинами, іншим агентам.

Потім настає той етап, який справді тривожить Anthropic: замкнений контур.

Якщо цей день настане, наступні версії Claude можуть постійно вдосконалюватися самим Claude — це називається рекурсивним самовдосконаленням.

Anthropic у тексті дуже обережно стверджує: ми ще не дійшли до цього моменту, і рекурсивне самовдосконалення не є невід’ємним. Але вона все ще підкреслює, що шлях до цього моменту вже почав ставати помітним.

Тому Anthropic у кінці статті говорить про уповільнення, а навіть призупинення. Це означає не те, що всі AI-компанії зараз повинні зупинити роботу, а те, що якщо ризики самовдосконалення AI в майбутньому продовжуватимуть зростати, передовим лабораторіям знадобиться координований і перевірний механізм уповільнення.

Іншими словами, «сингулярність» наставала, і людство повинно її контролювати.

Незупинний Claude

Якщо дивитися лише на поверхню, це дуже поглядна на майбутнє безпечна документація. Anthropic говорить про рекурсивне самовдосконалення, про те, як ШІ може все швидше вдосконалювати себе, і про те, що людське суспільство повинно заздалегідь підготувати механізми зниження швидкості та зупинки.

Але в контексті часу, коли Anthropic готується до IPO, ця стаття набуває іншого змісту.

У певному сенсі останні дії заводу A схожі на поведінку відмінника в класі, який постійно прагне звернути на себе увагу — він справді має здібності, але й справді багато підіграє.

Він хоче сказати не просто «у нас є дуже потужний Claude», а йти далі — «Claude допомагає нам створювати ще потужніший Claude».

Якщо Anthropic просто продає модель чи інструмент, їй важко повністю уникнути порівняння: у Anthropic є Claude, у OpenAI — GPT; у Anthropic є Claude Code, у OpenAI — Codex; Anthropic бореться за корпоративних клієнтів, і OpenAI також бореться за корпоративних клієнтів. Конкуренція між цими двома компаніями дуже запекла — все залежить від того, хто зможе розповісти ринку більш захопливу історію.

Варто зазначити, що саме 3 дні тому OpenAI у документі щодо управління передовими ШІ написала:

Ми також спостерігали ранні ознаки рекурсивного самовдосконалення в сьогоднішній системі: розвиток ШІ сам по собі прискорюється завдяки ШІ.

Це посилютиме тиск конкуренції між розробниками та державами та створить управлінські виклики, яких не зможуть вирішити існуючі інститути.

Через три дні Anthropic заявила: шлях Claude до рекурсивного самовдосконалення вже почав ставати помітним.

Клауд

Якщо Claude розвиватиметься так, як того очікується, це вже не буде звичайна історія продукту — це стане розробницьким інфляційним колесом.

Клауд пише код, запускає експерименти, оптимізує процеси навчання, а потім, навпаки, зменшує кількість аварій у власних продуктах Anthropic... Коли ця система почне працювати, Клауд стане не просто продуктом Anthropic, а важливим інструментом виробництва для Anthropic.

Користувачі бачать продукт Claude, корпоративні клієнти купують здатності Claude, але Anthropic справді хоче, щоб інвесторські ринки звернули увагу на те, що Claude вже вбудований у базові процеси розробки передових моделей — його помістили до двигуна Anthropic.

Ринки капіталу найбільше люблять історії про колесо інерції, як скарбниця, що неперервно приносить багатство: потужніший Claude дозволяє інженерам Anthropic об’єднувати більше коду, більше коду призводить до швидшої ітерації продукту та інфраструктури, швидші ітерації дозволяють дослідникам проводити більше експериментів, а більше експериментів, у свою чергу, допомагають зробити наступне покоління Claude сильнішим. Коли наступне покоління Claude стає сильнішим, це знову прискорює розробку Anthropic.

Швидкість ітерацій Claude також підтримує цей інерційний круг. Згідно з публічними датами випуску, з 2023 року до початку 2025 року основні оновлення моделей Claude зазвичай відбувалися раз на три-чотири місяці, але після входження у Claude 4 оновлення моделей Anthropic значно почастішали.

Claude 4 був випущений у травні 2025 року, Opus 4.1 — у серпні, Sonnet 4.5 — у вересні, Haiku 4.5 — у жовтні, Opus 4.5 — у листопаді.

До 2026 року Opus 4.6 був випущений 5 лютого, Sonnet 4.6 — 17 лютого, Opus 4.7 — 15 квітня, Opus 4.8 — 28 травня. Між Opus 4.7 і Opus 4.8 пройшло лише 42 дні.

Anthropic на поверхні каже: «Це може бути небезпечно, ми повинні заздалегідь підготувати гальма», але одночасно намагається намекнути: «Ми вже бачили, що відбувається, коли педаль газу натиснута».

Суть історії про IPO полягає саме в цьому: з одного боку, вона підкреслює ризики, а з іншого — піднімає своє технічне положення дуже високо.

Не всі компанії штучного інтелекту мають право обговорювати рекурсивне самовдосконалення; спочатку ви повинні переконати зовнішній світ, що ваш ШІ вже ввійшов у процес розробки ШІ, щоб мати право говорити про те, що це може вимагати глобальної координації.

OpenAI: Як це можливо?

Як згадувалося раніше, саме перед тим, як Anthropic опублікувала цю довгу статтю, OpenAI тільки-но винесла на обговорення рекурсивне самовдосконалення.

Але висловлювання обох компаній дуже відрізняються.

Стаття OpenAI «Демократичне управління передовим ШІ» — це політичний план, адресований Вашингтону, який ставить під питання не «як моделі стають сильнішими», а як обмежити передовий ШІ, коли він продовжує рухатися вперед.

Більшість інформації, згаданої в цьому звіті, не варто детально розбирати, але є одна ключова фраза: OpenAI стверджує, що в сучасних системах вже можна побачити перші ознаки рекурсивного самовдосконалення.

Цей вислів і ця довга стаття Anthropic насправді вказують на одну й ту саму направленість.

Тільки OpenAI говорить про інституції, а Anthropic — про себе.

OpenAI означає: розвиток ШІ відбувається занадто швидко, і існуючі структури управління можуть не встигати за ним, тому потрібні нові правила.

А Anthropic прямо показала цю систему ринку, повідомивши: Claude вже увійшов у наш процес розробки, тому ми бачимо шлях самоприскорення ШІ.

Це дія виглядає дуже розумно, відчувається, що всередині OpenAI вже почалися суперечки — це справді підлога ідеї! Ми були першими!

Це жартою, але OpenAI справді треба підтягнутися — швидше виводьте GPT 5.6.