Общая языковая модель только что вошла в химическую лабораторию и показала результаты, сопоставимые с программным обеспечением, специально разработанным для молекулярного анализа. Anthropic опубликовала исследовательский отчет 5 июня под названием «Превращение Claude в химика», в котором демонстрируется, что Claude Opus 4.7 способен выполнять задачи ядерного магнитного резонанса на уровне, соответствующем и в некоторых случаях превышающем специализированные инструменты NMR, такие как ChemDraw 25.0.2 и MestReNova 17.0.0.
Цифры рассказывают историю
Исследование Anthropic протестировало Opus 4.7 на 20 соединениях, взятых из недавних препринтов по синтетической химии, оценив как прямое предсказание (моделирование внешнего вида спектра на основе молекулярной структуры), так и обратную структурную элициацию (восстановление молекулы на основе спектральных данных).
По сдвигам протонного ЯМР Opus 4.7 показал наименьшую среднюю ошибку плюс-минус 0,079 ppm. Для сдвигов углерода он разделил первое место с MestReNova — плюс-минус 1,37 ppm. Чтобы перевести это в понятные термины: части на миллион — это стандартная единица измерения химических сдвигов в ЯМР, и ошибки менее 0,1 ppm по данным протонов свидетельствуют о действительно высоком качестве предсказаний.
Модель также продемонстрировала лучшую согласованность при прогнозировании паттернов расщепления пиков и значений J-связывания — двух характеристик, на которые химики сильно полагаются для различения похожих молекулярных структур.
С другой стороны, когда модель должна была выводить структуры на основе данных 1D ЯМР и масс-спектрометрии высокого разрешения, Opus 4.7 успешно восстановил все более простые целевые структуры при каждой попытке. Когда команда добавила подсказки, основанные на исходных веществах, для более сложных целей, модель успешно определила четыре из семи более плотных структур во всех запусках.
Почему это отличается от типовых ИИ-тестов
Что делает результат Anthropic необычным, так это то, что Opus 4.7 не был дообучен на данных, специфичных для химии, для этой задачи. Он работает с обычными данными, скопированными химиками, без необходимости в специальной настройке. На английском: химик может скопировать свои данные ЯМР в окно чата и получить предложение по структуре, не требуя лицензии на проприетарное программное обеспечение.
Исследование также не требовало данные 2D ЯМР, которые обычно считаются необходимыми для сложной элицидации структуры. Двумерные ЯМР-эксперименты занимают больше времени и генерируют больше данных для интерпретации. Обход этого требования, даже для более простых соединений, оптимизирует рабочий процесс, который оставался в основном неизменным десятилетиями.
