- Anthropic восстановила Fable 5 глобально после окончания экспортных ограничений США 30 июня.
- Новые меры безопасности теперь блокируют обход в более чем 99% протестированных случаев.
- Anthropic и партнеры Project Glasswing разрабатывают общую рамку для оценки уязвимостей ИИ.
Anthropic восстановила глобальный доступ к своей модели Claude Fable 5 после того, как правительство США сняло экспортные ограничения, временно ограничившие доступ. Компания сообщила, что эти ограничения, введенные 12 июня, заставили ее приостановить доступ, поскольку она не могла немедленно проверять национальность пользователей в реальном времени.
С отменой ограничений с 30 июня Fable 5 теперь доступен на платформе Claude, Claude.ai, Claude Code и Claude Cowork, а доступ к Mythos 5 возобновлен для ограниченной группы утвержденных организаций в США.
Помимо восстановления, Anthropic подробно описала новые меры кибербезопасности, представила планы по созданию отраслевой рамочной модели по борьбе с выходом из-под контроля ИИ и рассказала о расширении сотрудничества с американскими государственными агентствами.
Ограничения на экспорт сняты после двухнедельной приостановки
Anthropic сказала, что Fable 5 и Mythos 5 были запущены 9 июня на одной и той же базовой модели, хотя каждая из них была разработана для разных целей. Fable 5 была выпущена с усиленными мерами кибербезопасности для обычных пользователей, в то время как Mythos 5 доступна только избранным партнерам Project Glasswing, работающим над оборонительной кибербезопасностью.
Экспортные ограничения были введены после отчета, описывающего метод, обходящий некоторые из защитных механизмов Fable 5. Согласно Anthropic, тестирование, проведенное с государственными агентствами и партнерами, показало, что несколько других ИИ-моделей могут идентифицировать те же программные уязвимости, о которых говорится в отчете, и каждая протестированная модель также смогла сгенерировать ту же демонстрацию эксплуатации одной уязвимости.
Anthropic заявила, что сообщаемое поведение не раскрывает возможности, уникальные для Mythos 5, а связано с задачей кибербезопасности, которая была заблокирована в рамках предохранительных мер Fable 5’s.
Новые меры защиты и отраслевая координация
Для устранения сообщённого обхода Anthropic внедрила обновлённый классификатор безопасности, блокирующий выявленную технику в более чем 99% протестированных случаев. При блокировке запросов пользователи будут перенаправлены на Claude Opus 4.8. Компания добавила, что обновлённая система может также увеличивать количество ложных срабатываний при обычных задачах программирования и отладки, пока продолжаются дальнейшие улучшения.
Отдельно Anthropic сообщила, что сотрудничает с Amazon, Microsoft, Google и другими партнерами Project Glasswing над созданием общей рамки для оценки выходов из ограничений ИИ. Предлагаемая система будет оценивать выходы из ограничений на основе прироста возможностей, широты возможностей, легкости превращения в оружие и степени обнаруживаемости, чтобы определить степень серьезности новых методов.
См. также:США разрешили Anthropic восстановить работу Mythos AI, пока Трамп угрожает пошлинами в 100%
Отказ от ответственности: Информация, представленная в этой статье, предназначена исключительно для информационных и образовательных целей. Статья не является финансовой консультацией или консультацией любого рода. Coin Edition не несет ответственности за любые убытки, понесенные в результате использования упомянутого контента, продуктов или услуг. Читателям рекомендуется проявлять осторожность перед предпринятием любых действий, связанных с компанией.
