Anthropic пропонує призупинити розробку ШІ на всьому ринку для оцінки ризиків

Anthropic, компанія, що стоїть за моделлю Claude AI, опублікувала блог-пост 4 червня, пропонуючи те, що рік тому здавалося немислимим з боку лідера в галузі ШІ: структурований тимчасовий припинення розробки передових ШІ у всій галузі.

Пропозиція, авторами якої є Маріна Фаваро та Джек Кларк, спрямована на конкретну і справді тривожну проблему. Моделі ШІ наближаються до здатності рекурсивно самовдосконалюватися, тобто вони можуть змінювати та покращувати власні можливості без участі людини.

Що саме пропонує Anthropic

Це не заклик вимкнути кожен GPU і йти додому. Anthropic закликає до координованої багатосторонньої структури, за якої основні лабораторії ШІ домовляються тимчасово призупинити найбільш просунуті розробки, поки дослідження безпеки та системи верифікації встигнуть наздогнати.

Anthropic стверджує, що односторонні дії, коли одна компанія або одна країна самостійно гальмують, є недостатніми і можуть бути протилежними до бажаного ефекту. Пропозиція передбачає співпрацю між добре забезпеченими лабораторіями в США, Китаї та інших країнах із серйозними програмами ШІ. Anthropic формулює виклик перевірки, використовуючи терміни, запозичені з контролю над ядерними озброєннями, де інспектори підтверджують дотримання за допомогою домовлених механізмів виявлення, а не покладаючись лише на довіру.

Anthropic заявила, що проведе власні дослідження щодо створення цих інструментів виявлення та верифікації, створивши еквівалент інспекторів з штучного інтелекту — системи, здатні підтвердити, чи приховано лабораторія продовжує розробку передових технологій, тоді як публічно стверджує дотримання призупинення.

Чому цей раз може відрізнятися від 2023 року

У 2023 році відкритий лист із закликом до шестимісячної зупинки навчання ШІ на рівні вище GPT-4 зібрав тисячі підписів дослідників і лідерів технологічної галузі. Він майже нічого не досяг. Конкурентний тиск виявився набагато переконливішим, ніж загальна тривога, і кожна велика лабораторія продовжувала розробку.

Пропозиція Anthropic має іншу структуру. Замість того щоб вимагати невизначеного мораторію, підтриманого підписами, компанія пропонує систему перевірної відповідності. Аналогія з контролем над ядерними озброєннями не зовсім невідповідна: міжнародні угоди про зменшення озброєнь працюють, коли працюють, завдяки системам інспекцій та наслідкам за порушення, а не тому, що підписанти обіцяли це на мізинці.

У 2023 році рекурсивне самовдосконалення було теоретичною проблемою. Зараз внутрішні спостереження Anthropic свідчать, що сучасні моделі все більше здатні до автономного кодування, наближаючись до межі, де система ШІ зможе значно внести вклад у свою наступну ітерацію.

Що це означає для інвесторів

Для будь-кого, хто має кошти в активів, пов’язаних з ШІ, включаючи криптовалютні токени, орієнтовані на ШІ, та блокчейн-проекти, що використовують машинне навчання, пропозиція Anthropic вводить нову змінну у розрахунок ризиків. Координований каркас призупинення, навіть якщо він ніколи повністю не реалізується, змінює дискусію з «чи варто регулювати ШІ» на «як ми забезпечимо дотримання правил через кордони».

Криптовалютні проекти з використанням ШІ — від децентралізованих обчислювальних мереж до токенів ШІ-агентів — частково базують свою цінність на припущенні, що розвиток ШІ буде продовжуватися без перерв. Достовірний механізм призупинення або навіть серйозні регуляторні кроки в цьому напрямку можуть внести невизначеність у ці цінності.

Децентралізовані системи верифікації можуть стати частиною рішення, яке шукає Anthropic. Якщо вам потрібно перевірити, чи дотримуються лабораторії по всьому світу обмежень у розробці, прозорий незмінний реєстр — не найгірший інструмент для цієї задачі.