Загальна мовна модель просто увійшла до хімічної лабораторії та впоралася з завданнями на рівні програмного забезпечення, створеного спеціально для молекулярного аналізу. Anthropic опублікувала дослідницький звіт 5 червня під назвою «Зробити Claude хіміком», в якому показано, що Claude Opus 4.7 може виконувати завдання ядерного магнітного резонансу на рівні, що відповідає, а в деяких випадках перевищує, спеціалізовані інструменти NMR, такі як ChemDraw 25.0.2 та MestReNova 17.0.0.
Числа розповідають історію
Дослідження Anthropic протестувало Opus 4.7 на 20 сполуках, отриманих з недавніх префруктів синтетичної хімії, оцінюючи як прямі прогнози (симуляція вигляду спектру на основі молекулярної структури), так і зворотне визначення структури (відновлення молекули на основі спектральних даних).
Щодо зміщень у протонному ЯМР, Opus 4.7 показав найнижчий середній відхилення на плюс-мінус 0,079 частин на мільйон. Щодо зміщень вуглецю, він поділив перше місце з MestReNova — плюс-мінус 1,37 частини на мільйон. Щоб зрозуміти це: частина на мільйон — це стандартна одиниця вимірювання хімічних зміщень у ЯМР, і похибки менше 0,1 частини на мільйон у даних протонів вказують на справді високоякісні прогнози.
Модель також продемонструвала кращу стабільність при передбаченні патернів розщеплення піків і значень J-зв’язку — двох характеристик, на які хіміки сильно покладаються для розрізнення схожих молекулярних структур.
З іншого боку, коли модель мала виводити структури з даних 1D ЯМР та мас-спектрометрії високого розділення, Opus 4.7 успішно відновив усі простіші цільові структури при кожній спробі. Коли команда додала підказки з вихідних матеріалів для більш складних цілей, модель успішно впоралася з чотирма з семи більш щільних структур у всіх запусках.
Чому це відрізняється від типових AI-бенчмарок
Те, що робить результат Anthropic незвичайним, — це те, що Opus 4.7 не було доналаштовано на хімічних даних для цієї задачі. Він працює зі звичайними виведеннями, скопійованими хіміком, без необхідності спеціальної налаштованості. На англійській: хімік може скопіювати свої дані ЯМР у вікно чату й отримати пропозицію структури назад, не потребуючи ліцензії на власне програмне забезпечення.
Дослідження також не вимагало дані 2D ЯМР, які зазвичай вважаються необхідними для розшифровки складних структур. Двовимірні ЯМР-експерименти тривають довше і генерують більше даних для інтерпретації. Обхід цієї вимоги, навіть для простіших сполук, спрощує робочий процес, який залишався майже незмінним протягом десятиліть.
