Генеральний директор Anthropic закликає до обов’язкових тестів безпеки для просунутих моделей ШІ

CoinDesk повідомляє:

Генеральний директор Anthropic Даріо Амодеї заявив, що уряд більше не може розглядати регулювання ШІ як довгострокову дослідницьку проблему. Зі швидким зростанням здатностей передових моделей США потрібно якнайшвидше встановити обов’язкові вимоги безпеки, а не полагоджуватися лише на добровільне розкриття інформації компаніями.

Пропонується звернутися до моделі авіаційного регулювання

Амодей у останній статті зазначив, що підхід до регулювання, заснований на прозорості, більше не достатній. Він закликає використовувати модель Федерального управління цивільної авіації США, встановлюючи вимоги до тестування перед запуском, технічного аудиту та постійного звітування для найпотужніших моделей ШІ.

За його задумом, передові моделі повинні проходити обов’язкове тестування третіми сторонами. Якщо вони не відповідають стандартам безпеки, уряд повинен мати право заборонити їхнє розгортання або навіть вимагати відкликання. Компанії також повинні захищати ваги моделей, проводити систематичні оцінки безпеки та повідомляти про серйозні інциденти.

Чотири типи ризиків визначені як пріоритетні

Стаття зосереджує увагу регулювання на чотирьох напрямках: кібербезпека, ризики біологічної зброї, втрата контролю над ШІ та автоматизовані здібності розробки. Амодей вважає, що, якщо ці здібності продовжуватимуть розвиватися, існуючі політичні процеси можуть не встигати за технологічним прогресом.

Він також запропонував, щоб уряд заздалегідь вирішував питання заміни робочих місць завдяки ШІ, а також звертав увагу на питання управління після прискорення розробки ліків. Водночас він закликав обмежити використання ШІ в національному правоохоронному нагляді та автономних збройних системах і посилити співпрацю між демократичними країнами у сфері ключових технологій ШІ.

Випуск нової моделі та прогрес щодо лістингу відбуваються паралельно

Перед та після публікації цієї статті Anthropic розширила доступ до своїх передових моделей. У вівторок компанія запустила Mythos 5, відкривши його для організацій у сфері кібербезпеки та урядових партнерів. Дослідники, зокрема з Британського інституту кібербезпеки штучного інтелекту, виявили, що ця модель може самостійно виконувати складні кібератаки.

Того ж тижня Anthropic також запустила Claude Fable 5 для загальної публіки. Для запитів, що стосуються кібербезпеки, біології, хімії та розробки ШІ, система перенаправляє їх на менш потужний Claude Opus 4.8, щоб зменшити ризик зловживання.

Проте ця продуктова схема викликала критику розробників і дослідників, яка зосереджена на збільшенні споживання токенів, обов’язковому зберіганні даних протягом 30 днів та тому, що деякі обмеження безпеки можуть зменшувати здатності моделі без чіткого попередження користувачів.

Додаткова інформація: Під час того, як AmoDei просуває дискусії щодо регулювання, Anthropic також просуває своє лістинг. Раніше цього місяця компанія подала документи на первинне публічне пропозицію до Комісії з цінних паперів і бірж США. У звіті також зазначається, що раніше генеральний директор OpenAI Сам Олтман критикував Anthropic за використання занепокоєнь щодо безпеки для просування більш суворого регулювання, і розбіжності між двома компаніями щодо шляху регулювання продовжуються.