Спеціалісти з кібербезпеки США проти експортних обмежень на моделі штучного інтелекту Anthropic

CoinDesk повідомляє:

Після того як уряд США вимагав від Anthropic обмежити експорт двох просунутих моделей — Fable і Mythos, група фахівців з кібербезпеки публічно протестувала проти цього рішення, вважаючи, що такі обмеження погіршують здатність захисних сторін використовувати передові ІІ для виявлення вразливостей, виправлення недоліків та підсилення програмного забезпечення.

На сьогодні листа підписали 76 експертів з кібербезпеки, зокрема колишній керівник безпеки Facebook Алекс Стамос, засновник Bugcrowd Кейсі Елліс, криптограф Джон Каллас, інформатик Пол Віксі та засновниця Luta Security Кеті Мусуріс. У листі зазначається, що в умовах швидкого розвитку технологій противника вилучення найсильніших засобів у захисту є небезпечним кроком.

Глобальна блокування доступу після наказу уряду

Anthropic зазначила, що уряд США на тиждень до того вдався до обмежень на експорт з міркувань національної безпеки, але не навів більш конкретних підстав. Після цього компанія призупинила доступ глобальних користувачів до Fable і Mythos.

Mythos був випущений у прев’ю-версії у квітні цього року. На той час Anthropic заявила, що модель демонструє високу здатність виявляти безпекові вразливості, тому доступ до неї необхідно строго обмежити, щоб запобігти зловживанню з боку зловмисних хакерів або іноземних суперників. Спочатку лише близько 50 компаній отримали доступ, пізніше цей список було розширено до близько 150 організацій у 15 країнах.

Суперечки зосереджені на так званих методах обходу

Anthropic також зазначила, що цей наказ Білого дому може бути пов’язаний із звітом, який стверджує, що існує спосіб обійти обмеження Fable, щоб розблокувати здатності, близькі до рівня Mythos.

Кеті Мусуріс заявила, що це досі неопубліковане дослідження було проведено дослідниками Amazon, і вона особисто ознайомилася з його змістом. Вона вважає, що стаття не демонструє справжнього методу «втечі». За її словами, дослідники лише просили модель виправити відкритий код, що містить відомі уразливості та штучно вставлені вразливості, а не змогли обійти існуючі захистні механізми моделі.

Вона зазначила, що такі дії є частиною повсякденної роботи команди безпеки, яка включає виявлення проблем, виправлення вад та перевірку ефективності патчів. Якщо таку здатність сприймати як обхід обмежень, це лише зменшить цінність моделі у сценаріях захисту.

Співавтори зазначили, що проблема не є виключною для Anthropic

У відкритому листі також зазначається, що ці методи застосовні не лише до моделей Anthropic, але й можуть виникати у моделей OpenAI GPT-5.5, Claude Opus 4.8 та Sonnet, які вже опубліковані Anthropic, а також китайської моделі Kimi 2.7.

Підписанти також закликають уряд США підвищити прозорість при розробці відповідних правил та просувати їх через більш відкриті процедури, опираючись на дослідження галузі та академічного середовища, щоб мінімізувати обмеження.