Claude Opus 4.7 da Anthropic iguala o software NMR em tarefas de química

Um modelo de linguagem de propósito geral acabou de entrar no laboratório de química e se saiu bem contra software especificamente desenvolvido para análise molecular. A Anthropic publicou um relatório de pesquisa em 5 de junho intitulado “Tornando Claude um químico”, demonstrando que o Claude Opus 4.7 pode realizar tarefas de espectroscopia de ressonância magnética nuclear em um nível que iguala e, em alguns casos, supera ferramentas dedicadas de RMN, como o ChemDraw 25.0.2 e o MestReNova 17.0.0.

Os números contam a história

O estudo da Anthropic testou o Opus 4.7 em 20 compostos provenientes de pré-impressões recentes de química sintética, avaliando tanto a previsão direta (simulando como um espectro deveria parecer dado uma estrutura molecular) quanto a elucidação inversa da estrutura (trabalhando de trás para frente a partir de dados espectrais para identificar a molécula).

Anúncio

Nos deslocamentos de RMN de hidrogênio, o Opus 4.7 apresentou o menor erro médio de ±0,079 ppm. Para os deslocamentos de carbono, empatou com o MestReNova em ±1,37 ppm. Para colocar isso em termos significativos: partes por milhão é a unidade padrão para medir deslocamentos químicos em RMN, e erros abaixo de 0,1 ppm nos dados de hidrogênio representam previsões de alta qualidade.

O modelo também superou o desempenho em consistência ao prever padrões de divisão de pico e valores de acoplamento J, duas características nas quais os químicos confiam fortemente para distinguir entre estruturas moleculares semelhantes.

Do lado inverso, onde o modelo precisava deduzir estruturas a partir de dados de RMN unidimensional e espectrometria de massa de alta resolução, o Opus 4.7 recuperou com sucesso todas as estruturas-alvo mais simples em cada tentativa. Quando a equipe adicionou pistas dos materiais de partida para alvos mais complexos, o modelo obteve sucesso em quatro das sete estruturas mais densas em todas as execuções.

Por que isso é diferente dos benchmarks típicos de IA

O que torna o resultado da Anthropic incomum é que o Opus 4.7 não foi ajustado com dados específicos de química para esta tarefa. Ele opera com leituras copiadas normalmente por químicos, sem necessidade de configuração especializada. Em inglês: um químico pode copiar seus dados de RMN em uma janela de bate-papo e receber uma proposta estrutural de volta, sem necessidade de licença de software proprietário.

O estudo também não exigiu dados de RMN 2D, que normalmente são considerados essenciais para a elucidação de estruturas complexas. Experimentos de RMN bidimensional levam mais tempo para serem realizados e geram mais dados para interpretação. Contornar esse requisito, mesmo para compostos mais simples, otimiza um fluxo de trabalho que permaneceu essencialmente inalterado por décadas.