- A Anthropic restaurou o Fable 5 globalmente após as restrições de exportação dos EUA terminarem em 30 de junho.
- Novas proteções agora bloqueiam a contornagem relatada em mais de 99% dos casos testados.
- A Anthropic e os parceiros do Project Glasswing estão desenvolvendo um framework compartilhado para avaliar jailbreaks de IA.
A Anthropic restaurou o acesso global ao seu modelo Claude Fable 5 após o governo dos EUA levantar as restrições de exportação que haviam restringido temporariamente a disponibilidade. A empresa afirmou que as restrições, introduzidas em 12 de junho, exigiram que suspendesse o acesso porque não conseguia verificar imediatamente a nacionalidade dos usuários em tempo real.
Com as restrições removidas a partir de 30 de junho, o Fable 5 agora está disponível em toda a plataforma Claude, Claude.ai, Claude Code e Claude Cowork, enquanto o acesso ao Mythos 5 foi retomado para um grupo limitado de organizações dos EUA aprovadas.
Junto com a restauração, a Anthropic detalhou novas medidas de segurança cibernética, apresentou planos para um framework setorial compartilhado sobre jailbreaks de IA e descreveu a cooperação expandida com agências governamentais dos EUA.
Controles de exportação suspensos após duas semanas de interrupção
Anthropic said que Fable 5 e Mythos 5 foram lançados em 9 de junho usando o mesmo modelo subjacente, embora cada um tenha sido projetado para propósitos diferentes. O Fable 5 foi lançado com proteções de cibersegurança mais robustas para usuários gerais, enquanto o Mythos 5 foi disponibilizado apenas a parceiros selecionados do Project Glasswing que trabalham em cibersegurança defensiva.
As restrições de exportação seguiram um relatório que descrevia um método que contornava algumas das salvaguardas do Fable 5. Segundo a Anthropic, testes realizados com agências governamentais e parceiros descobriram que vários outros modelos de IA conseguem identificar as mesmas vulnerabilidades de software mencionadas no relatório, e cada modelo testado também foi capaz de gerar a mesma demonstração para explorar uma única vulnerabilidade.
A Anthropic afirmou que o comportamento relatado não expôs capacidades únicas do Mythos 5 e, em vez disso, envolveu uma tarefa de cibersegurança que havia sido bloqueada como parte das salvaguardas preventivas do Fable 5’s.
Novas Salvaguardas e Coordenação Industrial
Para resolver a vulnerabilidade relatada, a Anthropic introduziu um classificador de segurança atualizado que bloqueia a técnica identificada em mais de 99% dos casos testados. Quando as solicitações são bloqueadas, os usuários serão redirecionados para o Claude Opus 4.8. A empresa acrescentou que o sistema atualizado também pode aumentar os falsos positivos durante tarefas rotineiras de codificação e depuração, enquanto refinamentos adicionais continuam.
Separadamente, a Anthropic afirmou que está trabalhando com a Amazon, Microsoft, Google e outros parceiros do Project Glasswing para desenvolver um framework comum para avaliar jailbreaks de IA. O sistema proposto avaliaria os jailbreaks com base no ganho de capacidade, amplitude da capacidade, facilidade de weaponização e descobribilidade, para ajudar a determinar a gravidade das técnicas recém-identificadas.
Relacionado:OS EUA Permitem que o Mythos AI da Anthropic Volte Online Enquanto Trump Ameaça Tarifas de 100%
Disclaimer: As informações apresentadas neste artigo são apenas para fins informativos e educacionais. O artigo não constitui aconselhamento financeiro ou qualquer outro tipo de aconselhamento. A Coin Edition não se responsabiliza por quaisquer perdas decorrentes do uso do conteúdo, produtos ou serviços mencionados. Recomenda-se aos leitores que exerçam cautela antes de tomar qualquer ação relacionada à empresa.
