Anthropic lança o modelo Mythos AI, temporariamente restrito a auditorias de segurança de infraestrutura

A Anthropic lançou o modelo de IA de alta potência codinome Mythos, que supera amplamente os modelos líderes atuais, como o Claude Opus 4.6, em capacidades de codificação, raciocínio e descoberta de vulnerabilidades; devido à sua capacidade revolucionária de ameaça à segurança, ainda não foi disponibilizado publicamente, mas iniciou o projeto Project Glasswing, em parceria com 12 instituições tecnológicas principais, incluindo AWS, Apple e Microsoft, e organizações de código aberto como a Linux Foundation, para uso inicial em auditorias de segurança e reforço da infraestrutura digital crítica global.

Autor do artigo: Tang Ren

Fonte: Mars Finance

Acho que a humanidade pode estar sendo alcançada pela IA em uma velocidade que ultrapassa o entendimento convencional.

Não sei como está a situação de vocês, mas pelo menos eu já não consigo mais viver sem IA; pelo menos 50% do meu trabalho diário é concluído com auxílio da IA.

E, além disso, essa proporção continua a aumentar.

Ao mesmo tempo, com o lançamento contínuo de novos modelos, tanto minha eficiência e qualidade no trabalho quanto meu gasto mensal em tokens estão crescendo rapidamente.

Ontem à noite, vi uma notícia de que a Anthropic lançou um modelo tão poderoso que nem eles mesmos ousam disponibilizá-lo publicamente.

O nome desse novo modelo é "Mythos", que em chinês significa "mito".

Atualmente é uma versão de pré-visualização, então oficialmente é chamado de "Mythos Preview". No entanto, este foi lançado sob o projeto chamado "Project Glasswing".

Sobre este projeto, eu falarei depois.

Mythos

No mês passado, um documento interno da Anthropic foi acidentalmente vazado, mencionando que um modelo maior e mais poderoso do que o Opus está em desenvolvimento, com o código Mythos.

Em seguida, a Anthropic atribuiu o vazamento a "erro humano" e não forneceu mais detalhes.

Now, the model codenamed Mythos has been officially announced.

Oficialmente anunciado, mas ainda não lançado publicamente. Ou seja, os usuários comuns ainda não podem usá-lo.

A razão é direta: a Anthropic acredita que esse modelo é muito poderoso e não deve ser disponibilizado para todos antes que os mecanismos de segurança estejam em vigor.

Acho que esta frase merece uma pausa para pensar por um segundo.

Normalmente, uma empresa de IA lança um novo modelo com o desejo de ir ao ar o mais rápido possível para conquistar o mercado, mas desta vez a abordagem da Anthropic parece claramente anormal.

Na minha opinião, não é que eles não queiram enviar, mas sim que tenham medo de enviar.

Porque o modelo chamado Mythos é realmente muito poderoso.

Primeiro, veja alguns dados de teste divulgados oficialmente.

Em capacidade de codificação, a diferença entre Mythos e o atualmente mais poderoso Claude Opus 4.6 é significativa; em todos os testes de referência, Mythos vence claramente o Opus 4.6.

Mythos

Em raciocínio, no teste GPQA Diamond (perguntas e respostas científicas de nível de pós-graduação), o resultado foi 94,6% contra 91,3%, com a vitória do Mythos.

Na Humanidade's Last Exam, tanto no teste com ferramentas quanto sem ferramentas, o Mythos venceu de forma esmagadora.

Mythos

Em habilidades de operação de computador relacionadas ao Agent, o Mythos alcançou 79,6% no OSWorld-Verified (conclusão autônoma de tarefas de computador), superando o Oputs 4.6, que obteve 72,7%.

Em cada dimensão, o Mythos é superior ao Opus 4.6, sendo em alguns casos claramente superior.

Mythos

Em alguns desempenhos de tarefas, a diferença já não é mais uma iteração gradual, mas uma melhoria significativa. Por exemplo, o SWE-bench Multimodal subiu de 27,1% para 59%, quase dobrando.

Uma das razões mais fundamentais para eles não ousarem entrar no Mythos é sua capacidade excessivamente forte de ultrapassar as barreiras de segurança do mundo de software.

Em outras palavras, todos os sistemas e softwares do mundo têm vulnerabilidades, e o Mythos pode descobrir e explorar essas vulnerabilidades em um nível superior ao humano.

Suponha que esse poder seja adquirido por hackers; então, todos os sistemas operacionais e softwares do mundo sofrerão, especialmente infraestruturas públicas e segurança nacional.

A Anthropic tem esta frase no anúncio, e depois de lê-la, achei isso assustadoramente preocupante.

Mythos

The encoding capabilities of AI models have reached an extremely high level, and in discovering and exploiting software vulnerabilities, they can nearly surpass everyone except the most skilled humans.

Sobre esta frase, gostaria de expandir um pouco mais.

Sou formado em programação, então sei como os softwares são construídos e quão grande pode ser a diferença entre o código escrito por pessoas diferentes.

Além disso, nenhuma software se atreve a afirmar que não possui falhas, mesmo que essa falha nunca tenha sido descoberta.

A vulnerabilidade anterior permaneceu silenciosa no sistema por décadas não porque o sistema fosse suficientemente seguro.

Mas porque encontrar vulnerabilidades exige habilidade profissional elevada, grande paciência e energia, além de muito tempo.

Muitas pessoas não sabem, e ainda menos ousam investir.

Essa "escassez de capacidade" constitui a premissa implícita de todo o mundo da segurança de software. Após a intervenção da IA, essa premissa começou a se enfraquecer.

A IA pode operar de maneira superior à maioria dos humanos não顶尖, e podemos usá-la para explorar vulnerabilidades, assim como para corrigi-las.

Para resolver esse problema, vou explicar a seguir o que é o Project Glasswing criado pela Anthropic.

Em poucas palavras, este é um projeto que utiliza a capacidade do Mythos para encontrar falhas nos sistemas de infraestrutura em todo o mundo.

Os participantes incluem AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Foundation e outras 5 instituições, totalizando 12.

Mythos

Este conjunto cobre computação em nuvem, sistemas operacionais, chips, navegadores, infraestrutura financeira, segurança cibernética e ecossistema de código aberto.

Em outras palavras, os principais participantes da infraestrutura digital global estão quase todos neste projeto.

A lógica central deste projeto é apenas uma: permitir que a equipe defensiva utilize imediatamente a capacidade deste modelo de IA de alto nível.

Porque, se o atacante obtiver primeiro ferramentas de mesmo nível, uma vez aberta a janela, será difícil fechá-la. A Anthropic se comprometeu a fornecer US$ 100 milhões em créditos de uso do modelo, cobrindo o período de pré-visualização de pesquisa.

Além das 12 instituições principais, mais de 40 organizações que mantêm infraestrutura de software crítica também receberam acesso para usar o Mythos para escanear seus próprios sistemas e projetos de código aberto.

Ao mesmo tempo, a Anthropic doou US$ 2,5 milhões para a Linux Foundation e US$ 1,5 milhões para a Apache Software Foundation, ambas infraestruturas do mundo do software.

Digamos que os diversos aplicativos, sites e sistemas que usamos atualmente são basicamente construídos sobre essa arquitetura subjacente.

Na minha opinião, a Anthropic fez uma boa ação desta vez, lançando não apenas um modelo mais poderoso, mas também gastando dinheiro para melhorar a infraestrutura global de informações.

After all, going naked benefits no one.

Talvez ainda não sinta plenamente o quão poderoso o Mythos é; encontrei três casos concretos no texto original da equipe oficial, e acho que eles demonstram melhor do que números.

Mythos

Primeiro, OpenBSD.

Este é um sistema operacional amplamente reconhecido por sua alta segurança, sendo utilizado em muitas infraestruturas críticas, incluindo o sistema iOS dos nossos iPhones, o sistema Android e até alguns sistemas internos de empresas e instituições.

Mythos descobriu uma vulnerabilidade existente há 27 anos, na qual um atacante pode fazer o alvo travar remotamente ao se conectar à máquina.

27 anos! Não é que ninguém se importe, é que ninguém encontrou.

Segundo, FFmpeg.

Quase todos os softwares que precisam processar vídeo dependem dele, e vocês o encontram em praticamente todos os players de vídeo que usam.

Uma vulnerabilidade escondida em uma linha de código escrita há 16 anos foi atacada repetidamente por ferramentas de teste automatizado por 5 milhões de vezes, sem ser detectada.

Mas Mythos foi encontrado.

O terceiro, kernel Linux.

This doesn't need much explanation—it's essentially the infrastructure of the entire internet and also the most worthy of caution.

Mythos não apenas descobriu algumas vulnerabilidades isoladas, mas conectou várias vulnerabilidades em uma cadeia de ataque.

Comece com permissões de usuário comum, escalone privilégios e alcance controle total sobre toda a máquina.

Sobre o Linux, isso é completamente diferente da natureza dos dois casos anteriores.

Encontrar vulnerabilidades é uma habilidade de análise.

Mas a falha na cadeia é a capacidade da estratégia.

Assim como muitos gerentes de produto, saber criar protótipos, escrever documentação e realizar análise de dados são habilidades pontuais. Mas conectar negócios, produto e estratégia é uma habilidade estratégica.

Um modelo capaz de planejar caminhos de ataque já não é apenas uma ferramenta de auditoria; ele se aproxima mais de um agente capaz de agir ativamente em ambientes digitais.

Nos três casos acima, a Anthropic adotou a abordagem de descobrir, relatar, corrigir e depois divulgar, e todos já foram corrigidos.

Ao ver isso, você entende o quão poderoso é o Mythos — como uma fera que ainda não foi solta da jaula, o mundo real precisa se preparar para sua chegada.

Quero fazer algumas observações aqui, que talvez sejam o verdadeiro começo das mudanças a seguir.

Primeiro, as suposições de segurança no mundo de software estão se tornando inválidas.

A estabilidade de software que damos por garantida hoje não vem inteiramente de um design de sistema suficientemente bom. Em grande medida, ela depende da escassez de capacidades de ataque.

Dito de forma simples, não é que o software seja fraco, mas sim que as pessoas não são fortes o suficiente.

Encontrar vulnerabilidades custa dinheiro, construir cadeias de exploração leva tempo e varreduras em larga escala exigem recursos. Por isso, muitas dívidas técnicas, bugs antigos e sistemas obsoletos continuam existindo, nunca sendo limpos de forma séria.

Assim como fazemos produtos, acreditar que o ciclo lógico está completo e tudo está sob controle não significa que realmente não haja mais problemas; é provável que tenhamos atingido o limite das nossas capacidades.

A capacidade demonstrada pelo Mythos reduziu a janela de tempo entre a descoberta e a exploração de vulnerabilidades de meses para minutos.

O que significa alguns minutos?

Isso significa que o ritmo dos patches e o processo de correção já não conseguem acompanhar a velocidade dos ataques.

Em segundo lugar, o mundo de código aberto sentirá primeiro a pressão.

A maioria dos softwares modernos hoje em dia repousa sobre uma grande quantidade de dependências de código aberto. Normalmente invisíveis, quando comprometidas, afetam toda a indústria simultaneamente.

Talvez alguns leitores não compreendam bem esse conceito; em linguagem simples, significa que todos os softwares que usamos hoje têm projetos de código aberto como base, e o código-fonte desses projetos é visível para todos.

No futuro, quando os modelos puderem varrer projetos de código aberto de forma contínua e em grande escala, o nível de pressão enfrentado pelos mantenedores da comunidade de código aberto será completamente diferente.

É por isso que a Anthropic fez doações para a Linux Foundation e a Apache Foundation.

Não é sobre fazer caridade, mas sim reconhecer que a infraestrutura de código aberto é a camada mais frágil, mas também a mais essencial, da base do mundo digital na era da IA; eles apenas não querem ser vistos como maus ou vilões.

Terceiro, os seres humanos serão enfraquecidos, e a IA começará a competir com a IA.

O valor da equipe de segurança de produtos da internet anteriormente residia no julgamento humano, na acumulação de experiência e na compreensão profunda do sistema.

No futuro, isso mudará de lógica.

É uma competição para ver quem tem o modelo mais poderoso, quem integra as ferramentas mais rapidamente e quem consegue incorporar a auditoria de IA no início do processo de desenvolvimento.

Não se trata de programadores serem substituídos, mas sim de que o modo de produção da indústria de segurança será reestruturado.

Do outro lado, milhares de vulnerabilidades críticas podem ser encontradas em poucas semanas. O problema é que os atacantes também acabarão tendo ferramentas de mesmo nível.

Naquela época, a segurança dos produtos de software não será mais uma luta entre pessoas, mas sim uma batalha entre modelos.

Desta vez, a Anthropic não apenas lançou capacidades, mas também riscos. Talvez seja exatamente a honestidade que toda a indústria mais precisa ver neste estágio.

Todos estão falando sobre como a IA está transformando a eficiência no trabalho, e isso não tem problema.

Mas o Mythos também nos lembra que o avanço das capacidades da IA acabará por se propagar do mundo do conteúdo para o mundo do software e, em seguida, para a infraestrutura de todo o mundo digital.

O mundo do conteúdo foi reescrito, afetando a lógica de tráfego.

O mundo do software foi reescrito, e a base foi movida.

Neste momento, lembrei-me de uma frase do filme "2012", que também servirá como encerramento deste artigo.

Seja quem você for, sem distinção de raça ou nacionalidade, amanhã não haverá diferença entre nós!