Casa Branca e Anthropic discutem estrutura de avaliação de segurança de modelos de IA

Relatório do CoinNews:

A Casa Branca está discutindo com a empresa de IA Anthropic um quadro de avaliação de segurança de modelos, com o objetivo de estabelecer um método unificado de classificação para vulnerabilidades de segurança em novas gerações de modelos de IA e, com base nisso, determinar se o governo precisa intervir. Isso ocorre após os EUA imporem restrições de exportação ao modelo mais recente da Anthropic devido a um problema de segurança anteriormente classificado como "escape".

Estabelecer um padrão unificado em torno da vulnerabilidade "jailbreak"

Segundo relatos, este framework será usado para avaliar a gravidade de eventos futuros semelhantes, com foco em três aspectos principais: o grau em que as medidas de proteção foram contornadas, as capacidades do modelo expostas e as consequências reais da vulnerabilidade.

Atualmente, ainda há uma divisão clara entre o governo e as empresas sobre essas questões. Anteriormente, o CEO da Anthropic, Dario Amodei, e autoridades governamentais divergiram quanto à classificação das vulnerabilidades relacionadas como problemas de segurança significativos. A reportagem aponta que o avanço da tecnologia de IA ocorre muito rapidamente, e os sistemas governamentais atuais ainda não são capazes de realizar avaliações consistentes sobre essas controvérsias.

As negociações continuam avançando após as restrições de exportação

A Casa Branca já havia imposto restrições de exportação à Anthropic, proibindo usuários externos de acessar seus últimos modelos Fable 5 e Mythos 5. A empresa, em seguida, suspendeu os serviços externos desses dois modelos.

A report mentioned that negotiations between the two sides nearly broke down last Friday, as Anthropic refused to take down Fable as requested by the government, arguing that the related vulnerabilities had limited impact and were insufficient to be classified as serious security flaws. Subsequently, the White House imposed export restrictions, forcing the company to remove the relevant models from the market.

No entanto, a partir do fim de semana, ambas as partes retomaram a comunicação. O secretário de Comércio dos EUA, Howard Lutnick, o diretor nacional de ciberespaço, Sean Cairncross, e o cofundador da Anthropic, Tom Brown, participaram de várias rodadas de chamadas prolongadas. Após isso, ambas as partes realizaram reuniões presenciais em Washington por quase uma semana.

A Casa Branca acelera a implementação de regras de segurança para IA

Relatos indicam que os representantes da Anthropic envolvidos nas negociações incluem Sarah Heck, diretora de políticas públicas, e o co-fundador Tom Brown. A empresa também enviou pesquisadores sênior e especialistas em segurança ao Departamento de Comércio dos EUA nesta segunda-feira para continuar as consultas com autoridades governamentais.

Esta rodada de discussões também reflete um julgamento mais realista: nenhum modelo de IA está totalmente imune a ataques de hackers. Portanto, o governo deseja primeiro estabelecer padrões claros para as empresas avaliarem riscos de segurança antes de decidir em quais situações medidas restritivas são necessárias.

Essa direção também ressoa com as discussões realizadas na recente reunião do G7. Várias empresas líderes de IA e alguns líderes nacionais mencionaram a necessidade de estabelecer rapidamente padrões mais claros para medir a segurança de modelos, a fim de enfrentar os riscos econômicos e de segurança nacional que podem surgir de sistemas de IA com capacidades em constante aumento.