Исследователи кибербезопасности критикуют Anthropic за блокировку защитной работы

Anthropic запустила Claude Fable 5 9 июня, и сообщество кибербезопасности уже называет его непригодным для работы, которая важна больше всего: обнаружения и устранения уязвимостей до того, как это сделают злоумышленники.

Новая модель, первая публично доступная версия из «семейства Mythos» ИИ-систем от Anthropic, поставляется с классификаторами безопасности, которые автоматически перенаправляют запросы высокого риска на более старую версию Claude Opus 4.8. Темы, вызывающие переключение, включают кибербезопасность, биологию, химию и дистилляцию моделей. Для исследователей безопасности это означает, что самый мощный инструмент в линейке по сути отказывается взаимодействовать с их повседневной работой.

Что делает Fable и почему это важно

Fable 5 делится своими базовыми возможностями с Claude Mythos 5 — более ограниченной моделью, которая зарекомендовала себя исключительно хорошо в выявлении программных недостатков. Во время тестирования в апреле 2026 года модели класса Mythos отметили более 23 000 критических уязвимостей в крупных репозиториях кода. Решением Anthropic стало создание публичной версии, сохраняющей общую интеллектуальность, но изолирующей острые грани. Компания утверждает, что более 95% сессий Fable 5 не требуют переключения на Opus 4.8.

Исследование уязвимостей, пенетрационное тестирование и ответственное раскрытие требуют задавать именно те вопросы, которые классификаторы Fable созданы для отклонения. Жалобы специалистов по безопасности сосредоточены на знакомом противоречии: механизмы безопасности, не способные различать вредоносные намерения и необходимость защиты, в итоге наказывают защитников.

Проблема двухуровневого доступа

Anthropic, похоже, разрабатывает модель с двойным доступом. Общие пользователи получат Fable. Проверенные профессионалы и организации в будущем могут получить доступ к полной программе Mythos, которая сохраняет неограниченные возможности.

Fable 5 стоит $10 за миллион входных токенов и $50 за миллион выходных токенов, что примерно вдвое выше цен, ранее связанных с Opus 4.8. Таким образом, пользователи платят больше за модель, которая для некоторых профессиональных рабочих процессов выполняет меньше задач. Развёртывание в настоящее время ограничено платными подписчиками.

Более широкие последствия для ИИ и безопасности

Проект Glasswing от Anthropic, лежащий в основе класса Mythos, продемонстрировал в апреле 2026 года, что эти модели могут систематически выявлять уязвимости в масштабе, обнаружив более 23 000 критических уязвимостей во время тестирования. Классификатор, помечающий все запросы, связанные с кибербезопасностью, одинаково относится к хакеру, действующему от имени государства, и к исследователю, участвующему в программе баг-бонусов, в результате чего легитимная работа блокируется, в то время как сложные злоумышленники, вероятно, всё равно находят обходные пути.

Если ограничительный подход Anthropic оттолкнет исследователей безопасности в пользу конкурирующих платформ, компания рискует потерять высокоценную базу пользователей, не улучшив при этом безопасность.