После того как правительство США потребовало от Anthropic ограничить экспорт двух продвинутых моделей — Fable и Mythos — группа специалистов по кибербезопасности открыто выступила против этого решения, заявив, что такие ограничения ослабляют способность защитных сторон использовать передовые ИИ для обнаружения уязвимостей, устранения дефектов и усиления программного обеспечения.
На сегодняшний день открытое письмо подписали 76 экспертов по кибербезопасности, включая бывшего руководителя безопасности Facebook Алекса Стамоса, основателя Bugcrowd Кейси Эллиса, криптографа Джона Калласа, компьютерного ученого Пола Викси и основателя Luta Security Кэти Муссури и других. В письме подчеркивается, что в условиях быстрого развития технологий противника изъятие самых мощных возможностей у обороняющихся сторон является опасным шагом.
Глобальная блокировка доступа после указа правительства
Anthropic заявила, что правительство США на прошлой неделе ввело ограничения на экспорт по соображениям национальной безопасности, не указав более конкретных оснований. Впоследствии компания приостановила доступ глобальных пользователей к Fable и Mythos.
Mythos был выпущен в апреле этого года в предварительной версии. В то время Anthropic заявила, что модель обладает высокой способностью выявлять уязвимости в безопасности, поэтому доступ к ней необходимо строго ограничить, чтобы предотвратить злоупотребление со стороны вредоносных хакеров или иностранных противников. Изначально право на использование получили около 50 компаний, позже этот список был расширен до примерно 150 организаций в 15 странах.
Споры сосредоточены на так называемых способах обхода
Anthropic также отметила, что это ограничение от Белого дома может быть связано с отчетом, в котором утверждается, что существует способ обойти ограничения Fable, чтобы раскрыть возможности, близкие к уровню Mythos.
Кэти Муссурис заявила, что это еще не опубликованное исследование было проведено исследователями Amazon, и она лично ознакомилась с его содержанием. Она считает, что в статье не представлен настоящий метод «выхода из изоляции». По ее словам, исследователи просто попросили модель исправить открытый исходный код, содержащий известные уязвимости и искусственно введенные уязвимости, а не успешно обойти существующие защитные механизмы модели.
Она отметила, что такие операции являются частью повседневных процедур команды безопасности, включающих выявление проблем, устранение дефектов и проверку эффективности исправлений. Если рассматривать эту способность как обход ограничений, это лишь снизит ценность модели в сценариях защиты.
Соавторы заявляют, что проблема не является исключительной для Anthropic
В открытом письме также говорится, что подобные методы применимы не только к моделям Anthropic: аналогичные ситуации могут возникнуть и в моделях OpenAI GPT-5.5, уже опубликованных Anthropic Claude Opus 4.8 и Sonnet, а также к китайской модели Kimi 2.7.
Соавторы также призывают правительство США повысить прозрачность при разработке соответствующих правил и продвигать их через более открытые процедуры, опираясь на исследования из отрасли и академического сообщества, чтобы минимизировать ограничения.
