Anthropic afirma que o caminho de autoaperfeiçoamento da IA está se tornando claro, despertando debate sobre a narrativa de IPO

Artigo | LetraAI

A Anthropic publicou ontem um artigo longo intitulado “When AI builds itself” (Quando a IA se constrói), que soa como um romance de ficção científica de Asimov, e o tema é de fato um conceito muito de ficção científica: recursive self-improvement (melhoria auto-recursiva).

Claude

Em resumo, anteriormente, pesquisadores humanos escreviam código, realizavam experimentos e treinavam modelos para tornar a IA mais poderosa. Mas se a própria IA começar a participar do design, treinamento, teste e otimização de suas próprias versões subsequentes, a velocidade do avanço da IA não será mais impulsionada apenas pelos humanos — poderá começar a ser guiada pela “autoevolução” da IA.

Para isso, a Anthropic fez um apelo:

We believe that if the world could choose to slow down or temporarily halt the development of frontier AI, allowing social structures and alignment research to catch up with technological progress, it would be greatly beneficial to the world.

Esta frase soa como um aviso de segurança, mas, dada a época em que a Anthropic se prepara para seu IPO, é difícil não interpretá-la como outra prévia narrativa: o Claude é tão útil que já começou a criar a próxima geração do Claude.

Uma nova tempestade já apareceu

Para ilustrar como a IA está cada vez mais envolvida no próprio desenvolvimento da IA, a Anthropic apresentou uma grande quantidade de dados internos.

Por exemplo, até maio de 2026, mais de 80% do código integrado ao repositório da Anthropic foi escrito pelo Claude. Antes do lançamento do Claude Code, esse número era apenas de dígitos únicos.

Até o segundo trimestre de 2026, segundo a Anthropic, a quantidade de código integrada diariamente pelos engenheiros já aumentou cerca de 8 vezes em relação a 2024.

Claude

Mais notável do que a quantidade de código é o fato de que o Claude está lidando com problemas de engenharia mais abertos.

A Anthropic afirma que, ao longo do último ano, a frequência com que os funcionários corrigiam o Claude, o reorientavam ou assumiam tarefas no meio do caminho vem diminuindo. Essa mudança não ocorre apenas em tarefas simples, mas também em tarefas abertas mais complexas.

Tarefas abertas são problemas sem instruções claras. Por exemplo, quando o sistema cai ou uma tarefa de treinamento falha, os engenheiros não sabem inicialmente como a solução deve ser e precisam investigar e avaliar ao mesmo tempo.

Essas tarefas anteriormente dependiam mais da experiência humana, e nas tarefas mais abertas, a taxa de sucesso do Claude atingiu 76% em maio de 2026, aumentando 50 pontos percentuais em seis meses.

Claude

Além de escrever código, a Anthropic também usa o Claude para revisão de código, verificando bugs, vulnerabilidades de segurança e outros defeitos. Eles descobriram, por meio de análise retrospectiva, que cerca de um terço dos bugs que causaram incidentes no site claude.ai poderiam ter sido impedidos antes do lançamento se cada alteração de código tivesse sido automaticamente revisada pelo Claude no passado.

Além disso, o Claude já está participando do processo de pesquisa.

A Anthropic tem um teste fixo: fornecer ao Claude um código para treinar um modelo pequeno e pedir que ele encontre maneiras de acelerar a execução do código sem alterar o resultado. Em maio de 2025, o Claude Opus 4 conseguia alcançar aproximadamente 3 vezes de aceleração; em abril de 2026, o Claude Mythos Preview já havia impulsionado esse número para cerca de 52 vezes.

Anthropic também mencionou um caso de pesquisa aberta em segurança de IA. Eles apresentaram uma pergunta a um agente impulsionado pelo Claude: um modelo mais fraco consegue supervisionar confiavelmente um modelo mais forte?

Esse processo requer formular hipóteses, testar hipóteses e compartilhar descobertas com agentes paralelos, iterando repetidamente.

Dois pesquisadores humanos gastaram uma semana para reduzir a lacuna em cerca de 23%; já o Claude, com um consumo acumulado de aproximadamente 800 horas e US$ 18.000 em poder de computação, reduziu 97%.

Este resultado, é claro, tem limitações: os problemas foram escolhidos por humanos, os critérios de avaliação foram definidos por humanos e os resultados não foram totalmente transferidos para modelos em escala de produção. Mas ainda assim, ele demonstra que o Claude já consegue, dentro de um quadro de pesquisa com direção definida por humanos, projetar experimentos, executá-los e iterá-los por conta própria.

Além disso, quando pesquisadores humanos seguem o caminho errado, o Claude ainda consegue fornecer julgamentos melhores sobre o próximo passo.

A Anthropic selecionou 129 sessões de pesquisa internas do Claude Code, nas quais pesquisadores humanos colaboraram com o Claude para resolver problemas de pesquisa abertos. A Anthropic identificou alguns pontos em que os humanos, posteriormente, demonstraram ter seguido caminhos desnecessários, e forneceu o contexto anterior a esses pontos para diferentes versões do Claude, observando quais sugestões o modelo faria para o próximo passo. Em seguida, um outro Claude, que conhecia o desfecho completo da sessão, atuou como julgador para determinar qual escolha — a sugestão do modelo ou a decisão humana — era melhor.

Os resultados mostram que, nos pontos em que os pesquisadores humanos já foram demonstrados ter espaço para melhoria, o Claude está se tornando cada vez mais capaz de sugerir o próximo passo melhor.

Claude

No passado, o avanço dos modelos de IA era impulsionado principalmente por pesquisadores e engenheiros humanos. Os humanos decidiam quais experimentos realizar, escrever código, treinar modelos e impulsionar a iteração das funcionalidades da IA.

Agora, cada vez mais etapas dessa cadeia estão sendo assumidas pelo Claude.

Anthropic forneceu uma tabela de estágios muito intuitiva:

Claude

De 2021 a 2023, a Anthropic não era diferente de empresas de tecnologia comuns: humanos escreviam código e documentos em laptops.

De 2023 a 2025, os chatbots começaram a entrar nos fluxos de trabalho. Engenheiros faziam os modelos gerarem trechos de código, que depois copiavam para os editores.

De 2025 a 2026, agentes de programação surgiram, e o Claude passou a ser capaz de escrever e modificar código autonomamente, às vezes até concluindo arquivos inteiros sozinho.

Hoje em dia, os agentes já podem executar código sozinhos e delegar tarefas que levam várias horas a outros agentes.

Depois disso, vem a fase que realmente preocupa a Anthropic: o ciclo fechado.

Se esse dia chegar, as versões subsequentes do Claude poderão ser continuamente aprimoradas pelo próprio Claude — isso é recursive self-improvement, ou aprimoramento recursivo próprio.

A Anthropic afirma com cautela no texto: ainda não chegamos a esse ponto, e a autoaprimoração recursiva não é inevitável. Mas ainda assim enfatiza que o caminho para esse ponto já começou a se tornar visível.

Por isso a Anthropic menciona, no final do artigo, a necessidade de desacelerar, ou até suspender. O significado não é que todas as empresas de IA parem imediatamente suas operações, mas sim que, se os riscos de autoaperfeiçoamento da IA continuarem aumentando no futuro, os laboratórios de ponta precisarão de um mecanismo coordenado e verificável para desacelerar.

Em outras palavras, o ponto de singularidade está chegando, e a humanidade deve controlá-lo.

Claude inarrestável

Se observado apenas superficialmente, este é um documento de segurança extremamente proativo. A Anthropic fala sobre autoaprimoramento recursivo, sobre a possibilidade de a IA aprimorar-se cada vez mais rapidamente e sobre a necessidade da sociedade humana se preparar antecipadamente para mecanismos de desaceleração e pausa.

Mas, no contexto do momento em que a Anthropic se prepara para seu IPO, este artigo adquire outro significado.

De certa forma, os últimos movimentos da Fábrica A são como aquele aluno modelo irritante da sala — ele realmente tem capacidade, mas também é mesmo um falso.

Ele não quer apenas dizer “temos um Claude muito forte”; vai um passo além, quer dizer que “o Claude está nos ajudando a criar um Claude ainda mais forte”.

Se a Anthropic apenas vender um modelo ou uma ferramenta, será difícil escapar completamente da comparação horizontal: a Anthropic tem o Claude, a OpenAI tem o GPT; a Anthropic tem o Claude Code, a OpenAI tem o Codex; a Anthropic busca clientes corporativos, e a OpenAI também busca clientes corporativos. A competição entre as duas empresas é muito acirrada, e tudo depende de qual delas conseguir contar uma história maior para o mercado.

Observe que, apenas três dias atrás, a OpenAI escreveu em um documento sobre a governança de IA avançada:

Também observamos sinais iniciais de autoaperfeiçoamento recursivo no sistema de hoje: o próprio desenvolvimento da IA está sendo acelerado pela IA.

Isso aumentará a pressão competitiva entre desenvolvedores e países e trará desafios de governança que as instituições existentes não conseguem enfrentar.

Três dias depois, a Anthropic disse: O caminho do Claude para a autoaprimoração recursiva já começou a se tornar visível.

Claude

Se o Claude realmente se desenvolver como esperado, não será apenas uma narrativa de produto comum, mas se tornará um ciclo de desenvolvimento.

Claude escreve código, executa experimentos, otimiza fluxos de treinamento e, em seguida, reduz acidentes nos próprios produtos da Anthropic... Assim que esse sistema estiver em funcionamento, o Claude não será apenas um produto da Anthropic, mas também uma importante ferramenta de produção da Anthropic.

O usuário vê o produto Claude; os clientes corporativos compram a capacidade do Claude, mas o que a Anthropic realmente deseja que os mercados financeiros percebam é que o Claude já está integrado aos processos fundamentais de desenvolvimento de modelos avançados — ele foi colocado no motor da Anthropic.

Os mercados financeiros adoram histórias de rodas de inércia, como um pote da fortuna que traz riqueza sem fim: um Claude mais poderoso permite que os engenheiros da Anthropic integrem mais código; mais código permite que produtos e infraestrutura sejam iterados mais rapidamente; iterações mais rápidas permitem que pesquisadores realizem mais experimentos; e mais experimentos, por sua vez, ajudam a tornar a próxima geração do Claude mais forte. Quando a próxima geração do Claude se tornar mais forte, continuará acelerando a pesquisa e o desenvolvimento da Anthropic.

A velocidade de iteração do Claude também está impulsionando esse ciclo. De acordo com as datas de lançamento públicas, de 2023 ao início de 2025, as atualizações principais do modelo Claude ocorriam geralmente a cada três ou quatro meses; porém, após a entrada no Claude 4, as atualizações do modelo da Anthropic ficaram significativamente mais frequentes.

Claude 4 foi lançado em maio de 2025, Opus 4.1 em agosto, Sonnet 4.5 em setembro, Haiku 4.5 em outubro e Opus 4.5 em novembro.

Em 2026, o Opus 4.6 foi lançado em 5 de fevereiro, o Sonnet 4.6 em 17 de fevereiro, o Opus 4.7 em 15 de abril e o Opus 4.8 em 28 de maio. Entre o Opus 4.7 e o Opus 4.8, houve apenas 42 dias.

A Anthropic aparentemente está dizendo: “Isso pode ser perigoso, precisamos nos preparar para frear antecipadamente”, mas também está sugerindo ao mesmo tempo: “Já vimos o que acontece quando o acelerador é pressionado.”

A sutileza da narrativa do IPO está nisso: ela ao mesmo tempo enfatiza os riscos e eleva sua posição tecnológica.

Nem todas as empresas de IA têm direito a discutir autoaperfeiçoamento recursivo; você precisa primeiro fazer com que o público externo acredite que sua IA já entrou no processo de desenvolvimento de IA, antes de poder afirmar que isso pode exigir coordenação global.

OpenAI: Como é possível fazer isso?

Anteriormente, foi mencionado que, logo antes da Anthropic publicar este artigo longo, a OpenAI acabou de colocar a autoaprimoração recursiva na mesa.

Mas as duas empresas têm versões muito diferentes.

O artigo da OpenAI, "Democratic Governance of Frontier AI", é um plano de políticas dirigido a Washington, que não se preocupa com "como os modelos se tornam mais fortes", mas sim com como restringir a IA de ponta à medida que continua avançando.

A maioria dos conteúdos mencionados no relatório não é adequada para ser detalhada, mas uma frase é crucial: a OpenAI afirma que, nos sistemas atuais, já é possível observar sinais iniciais de autoaprimoramento recursivo.

Esta frase e o longo artigo da Anthropic apontam na mesma direção.

Enquanto a OpenAI fala sobre instituições, a Anthropic fala sobre si mesma.

OpenAI significa que o desenvolvimento da IA está acontecendo muito rápido e as estruturas de governança atuais podem não conseguir acompanhar, por isso é necessário um novo conjunto de regras.

E a Anthropic expôs diretamente esse sistema, informando o mercado: o Claude já entrou em nosso processo de desenvolvimento, portanto vimos o caminho de autoaceleração da IA.

Essa jogada foi muito inteligente; parece que já estão se atrapalhando dentro da OpenAI — isso é claramente uma cópia da nossa ideia! Nós fomos os primeiros!

Só estou brincando, mas a OpenAI realmente precisa se esforçar mais — trazam o GPT 5.6 já!