Claude Opus 4.7 de Anthropic iguala al software NMR en tareas de química

Un modelo de lenguaje de propósito general acaba de entrar en el laboratorio de química y se desempeñó a la altura de software diseñado específicamente para el análisis molecular. Anthropic publicó un informe de investigación el 5 de junio titulado “Hacer de Claude un químico”, demostrando que Claude Opus 4.7 puede realizar tareas de espectroscopía de resonancia magnética nuclear a un nivel que iguala, y en algunos casos supera, herramientas dedicadas de RMN como ChemDraw 25.0.2 y MestReNova 17.0.0.

Los números cuentan la historia

El estudio de Anthropic probó Opus 4.7 en 20 compuestos obtenidos de preimpresiones recientes de química sintética, evaluando tanto la predicción directa (simular cómo debería verse un espectro dado una estructura molecular) como la elucidación inversa de estructura (trabajar hacia atrás a partir de datos espectrales para determinar la molécula).

Anuncio

En los desplazamientos de RMN de hidrógeno, Opus 4.7 obtuvo el menor error promedio de ±0,079 ppm. Para los desplazamientos de carbono, empató con MestReNova en ±1,37 ppm. Para ponerlo en términos significativos: las partes por millón son la unidad estándar para medir desplazamientos químicos en RMN, y los errores inferiores a 0,1 ppm en los datos de hidrógeno representan predicciones de alta calidad.

El modelo también superó en consistencia al predecir patrones de división de picos y valores de acoplamiento J, dos características en las que los químicos confían enormemente para distinguir entre estructuras moleculares similares.

En el lado inverso, donde el modelo tenía que deducir estructuras a partir de datos de RMN unidimensional y espectrometría de masas de alta resolución, Opus 4.7 recuperó exitosamente todas las estructuras objetivo más simples en cada intento. Cuando el equipo añadió pistas provenientes de los materiales de partida para estructuras más complejas, el modelo logró éxito en cuatro de siete estructuras más densas en todos los ensayos.

¿Por qué esto es diferente de los benchmarks de IA típicos?

Lo que hace inusual el resultado de Anthropic es que Opus 4.7 no fue afinado con datos específicos de química para esta tarea. Funciona con lecturas pegadas por químicos de forma rutinaria, sin necesidad de configuración especializada. En inglés: un químico puede copiar sus datos de RMN en una ventana de chat y recibir una propuesta estructural, sin necesidad de una licencia de software propietario.

El estudio tampoco requirió datos de RMN 2D, que normalmente se consideran esenciales para la elucidación de estructuras complejas. Los experimentos de RMN bidimensional tardan más en ejecutarse y generan más datos para interpretar. Evitar este requisito, incluso para compuestos más simples, optimiza un flujo de trabajo que ha permanecido en gran medida inalterado durante décadas.