Білий дім обговорює з компанією AI Anthropic рамки оцінки безпеки моделей з метою створення єдиної системи класифікації вразливостей у нових поколіннях моделей ШІ та визначення, чи потрібно урядовому втручанню. Це відбувається після того, як США раніше ввели обмеження на експорт останньої моделі Anthropic через проблему безпеки, яку було визначено як «втечу».
Створення єдиної стандартизації навколо вразливості “втечі”
За повідомленнями, ця рамка буде використовуватися для оцінки серйозності майбутніх подібних подій, з акцентом на три аспекти: ступінь обходу захисних заходів, виявлені здібності моделі та наслідки вразливості в реальних умовах.
Наразі розбіжності між урядом і бізнесом щодо цих питань залишаються помітними. Раніше генеральний директор Anthropic Даріо Амодей і урядові чиновники різно оцінювали, чи є ці вразливості серйозною проблемою безпеки. У матеріалі зазначається, що розвиток технологій ШІ відбувається занадто швидко, і існуюча урядова система ще не здатна надати єдину оцінку таких спорів.
Переговори продовжуються після обмежень на експорт

Раніше Білий дім наклав обмеження на експорт для Anthropic, заборонивши зарубіжним користувачам отримувати доступ до їхніх останніх моделей Fable 5 і Mythos 5. Після цього компанія призупинила надання цих двох моделей зовнішнім користувачам.
У доповіді зазначається, що минулого п’ятниці переговори між сторонами майже розвалилися. Причиною стало відмовлення Anthropic виконати вимогу уряду відключити Fable, оскільки компанія вважала, що відповідні вразливості мають обмежений вплив і не можуть вважатися серйозними недоліками безпеки. Після цього Білий дім застосував експортні обмеження, змусивши компанію вивести відповідні моделі з ринку.
Однак з початком вихідних сторони знову відновили діалог. У багатьох тривалих телефонних розмовах взяли участь міністр торгівлі США Говард Латнік, національний директор з кібербезпеки Шон Кернкросс та співзасновник Anthropic Том Браун. Після цього сторони провели майже тиждень зустрічей на місці у Вашингтоні.
Білий дім прискорює впровадження правил безпеки ШІ
Згідно зі звітом, у переговорах з боку Anthropic брали участь керівник з питань публічної політики Сара Хек та співзасновник Том Браун. Компанія також відправила висококваліфікованих дослідників та експертів з безпеки до Міністерства торгівлі США у понеділок для продовження консультацій із урядовими чиновниками.
Ця дискусія також відображає більш реалістичне розуміння: жодна модель ШІ не може бути повністю захищена від хакерських атак. Тому уряд хоче спочатку визначити стандарти оцінки безпеки компаніями, перш ніж вирішувати, в яких випадках слід застосовувати обмеження.
Цей напрямок також знаходить відгук у обговореннях на останній зустрічі G7. Кілька провідних компаній у сфері ШІ та деякі лідери країн зазначили, що необхідно як можно швидше розробити чіткі стандарти оцінки безпеки моделей, щоб зменшити економічні та національні ризики, пов’язані з постійно зростаючими можливостями систем ШІ.
