- Anthropic відновила Fable 5 глобально після закінчення американських експортних обмежень 30 червня.
- Нові заходи безпеки тепер блокують виявлені обходи в більш ніж 99% тестових випадків.
- Anthropic та партнери Project Glasswing розробляють спільну рамку для оцінки виходів за межі обмежень ШІ.
Anthropic відновила глобальний доступ до своєї моделі Claude Fable 5 після того, як уряд США скасував експортні обмеження, які тимчасово обмежили доступність. Компанія зазначила, що ці обмеження, введені 12 червня, змусили її призупинити доступ, оскільки вона не могла відразу перевірити національність користувачів у реальному часі.
З відміною обмежень з 30 червня Fable 5 тепер доступний на всіх платформах Claude, Claude.ai, Claude Code та Claude Cowork, а також відновлено доступ до Mythos 5 для обмеженої групи схвалених американських організацій.
Паралельно з відновленням Anthropic детально описала нові заходи кібербезпеки, представила плани щодо спільної галузевої рамки щодо виходів з обмежень ШІ та описала розширену співпрацю з агентствами уряду США.
Обмеження на експорт зняті після двотижневої призупинення
Anthropic said, що Fable 5 і Mythos 5 були запущені 9 червня за допомогою однієї й тієї ж базової моделі, хоча кожна з них була розроблена для різних цілей. Fable 5 була випущена зі зміцненими заходами кібербезпеки для загальних користувачів, тоді як Mythos 5 була доступна лише обраним партнерам Project Glasswing, які працюють над оборонною кібербезпекою.
Експортні обмеження були введені після звіту, який описував метод, що обходить деякі захисти Fable 5. За словами Anthropic, тестування, проведене з урядовими агентствами та партнерами, показало, що кілька інших моделей ШІ можуть виявити ті самі програмні вразливості, про які йдеться у звіті, і кожна протестована модель також змогла створити ту саму демонстрацію експлуатації однієї вразливості.
Anthropic зазначила, що звітоване поведінкове явище не відображало можливостей, властивих виключно Mythos 5, а замість цього стосувалося завдання з кібербезпеки, яке було заблоковане як частина захисних заходів Fable 5.
Нові заходи безпеки та галузева координація
Щоб вирішити повідомлений обхід, Anthropic представила оновлений класифікатор безпеки, який блокує виявлену техніку в більш ніж 99% тестових випадків. Коли запити блокуються, користувачі будуть перенаправлені на Claude Opus 4.8. Компанія додала, що оновлена система може також збільшувати кількість ложних спрацьовувань під час звичайних завдань з програмування та виправлення помилок, поки тривають подальші удосконалення.
Окремо Anthropic повідомила, що працює з Amazon, Microsoft, Google та іншими партнерами Project Glasswing над розробкою загальної рамки для оцінки виходів з обмежень штучного інтелекту. Запропонована система буде оцінювати виходи з обмежень на основі зростання здатностей, широти здатностей, легкості використання в зловмисних цілях та виявляємості, щоб допомогти визначити ступінь серйозності ново виявлених методів.
Пов’язано:США дозволили Anthropic’s Mythos AI знову підключитися, поки Трамп загрожує 100% тарифами
Відмова від відповідальності: Інформація, наведена в цій статті, має лише інформаційний та освітній характер. Стаття не є фінансовою радою чи будь-якою іншою радою. Coin Edition не несе відповідальності за будь-які втрати, спричинені використанням контенту, продуктів або послуг, згаданих у статті. Рекомендуємо читачам діяти обережно перед виконанням будь-яких дій, пов’язаних із компанією.
