汎用言語モデルが化学実験室に立ち入り、分子分析のために特化して開発されたソフトウェアと対等に競い合った。Anthropicは6月5日に「Claudeを化学者にする」と題した研究報告を公開し、Claude Opus 4.7がChemDraw 25.0.2やMestReNova 17.0.0などの専用NMRツールと同等、あるいはそれ以上のレベルで核磁気共鳴分光法のタスクを実行できることを実証した。
数字が物語を語る
Anthropicの研究は、最近の合成化学のプレプリントから抽出された20の化合物を対象にOpus 4.7をテストし、分子構造からスペクトルの姿を予測する順方向予測と、スペクトルデータから分子構造を逆算する逆方向構造同定の両方を評価しました。
水素NMRシフトにおいて、Opus 4.7は平均誤差±0.079 ppmで最低値を記録しました。炭素シフトでは、MestReNovaと並んで±1.37 ppmの誤差でした。これを具体的に説明すると、NMRにおける化学シフトの測定単位はppm(parts per million)であり、水素データの誤差が0.1 ppm未満であることは、非常に高品質な予測を意味します。
このモデルは、化学者が類似する分子構造を区別するために大きく依存するピーク分割パターンとJ結合値の予測においても一貫性で優れた性能を発揮しました。
逆に、1D NMRおよび高分解能質量分析データから構造を推論する必要があった場合、Opus 4.7はすべての試行でより単純なターゲット構造をすべて再構成しました。チームがより複雑なターゲットに対して開始物質からの手がかりを追加したところ、すべての試行を通じて7つのより密な構造のうち4つで成功しました。
これが従来のAIベンチマークと異なる理由
Anthropicの結果が異例なのは、Opus 4.7がこのタスクのために化学特化データでファインチューニングされていないことです。特別な設定は必要なく、化学者が通常の測定データをコピーして貼り付けるだけで動作します。英語では、化学者がNMRデータをチャットウィンドウにコピーすれば、プロプライエタリなソフトウェアのライセンスなしで構造の提案を受け取ることができます。
この研究は、複雑な構造の解明には通常不可欠とされる2D NMRデータを必要としなかった点でも注目される。2次元NMR実験は実行に時間がかかり、より多くのデータを生成する。この要件を回避することで、数十年にわたりほとんど変化のなかったワークフローが簡素化される。
