一個通用語言模型剛走進化學實驗室,並與專為分子分析設計的軟體一較高下。Anthropic 於 6 月 5 日發布了一份名為《讓 Claude 成為化學家》的研究報告,證明 Claude Opus 4.7 能夠執行核磁共振波譜學任務,其表現與專用 NMR 工具如 ChemDraw 25.0.2 和 MestReNova 17.0.0 相當,甚至在某些情況下更勝一籌。
數字講述了故事
Anthropic 的研究對 Opus 4.7 在來自近期合成化學預印本的 20 種化合物上進行了測試,評估了正向預測(根據分子結構模擬光譜應呈現的樣貌)和逆向結構解析(從光譜數據反推分子結構)。
在氫核磁共振化學位移方面,Opus 4.7 的平均誤差最低,為 ±0.079 ppm;在碳位移方面,其與 MestReNova 並列,誤差為 ±1.37 ppm。換言之:ppm(百萬分之一)是核磁共振中測量化學位移的標準單位,氫數據誤差低於 0.1 ppm 代表預測品質極高。
該模型在預測峰值分裂模式和 J 耦合值方面也表現出更高的一致性,這兩項特徵是化學家用來區分相似分子結構的重要依據。
在相反的情況下,當模型需要從 1D NMR 和高解析度質譜數據中推斷結構時,Opus 4.7 在每次嘗試中都成功恢復了所有較簡單的目標結構。當團隊為更複雜的目標加入起始物料的提示時,該模型在所有運行中成功解析了七個更密集結構中的四個。
為何這與典型的 AI 基準不同
Anthropic 結果的特別之處在於,Opus 4.7 並未針對此任務進行化學專用數據的微調。它可直接處理化學家複製的常規讀數,無需任何專門設置。用英文來說,化學家只需將其 NMR 數據複製到聊天窗口中,即可獲得結構建議,無需專有軟體授權。
該研究還特別未要求使用 2D NMR 數據,而 2D NMR 數據通常被視為複雜結構解析所必需的。二維 NMR 實驗需要更長的運行時間,並產生更多需要解讀的數據。即使對於較簡單的化合物,繞過這一要求也能簡化數十年來幾乎未變的流程。
