Một mô hình ngôn ngữ đa năng vừa bước vào phòng thí nghiệm hóa học và thể hiện khả năng ngang ngửa với các phần mềm được thiết kế đặc biệt để phân tích phân tử. Anthropic đã công bố báo cáo nghiên cứu vào ngày 5 tháng 6 với tiêu đề “Làm cho Claude trở thành một nhà hóa học”, cho thấy Claude Opus 4.7 có thể thực hiện các nhiệm vụ phổ cộng hưởng từ hạt nhân ở mức độ tương đương và trong một số trường hợp vượt trội hơn các công cụ chuyên dụng như ChemDraw 25.0.2 và MestReNova 17.0.0.
Con số kể nên câu chuyện
Nghiên cứu của Anthropic đã kiểm tra Opus 4.7 trên 20 hợp chất được lấy từ các bản in trước gần đây trong hóa học tổng hợp, đánh giá cả dự đoán xuôi (mô phỏng phổ sẽ trông như thế nào dựa trên cấu trúc phân tử) và giải cấu trúc ngược (làm việc ngược từ dữ liệu phổ để xác định phân tử).
Về độ dịch chuyển NMR hydro, Opus 4.7 có sai số trung bình thấp nhất ở mức ±0,079 ppm. Đối với độ dịch chuyển carbon, nó đồng hạng với MestReNova ở mức ±1,37 ppm. Để chuyển thành một thông tin có ý nghĩa: phần trên triệu (ppm) là đơn vị tiêu chuẩn để đo độ dịch chuyển hóa học trong NMR, và các sai số dưới 0,1 ppm trên dữ liệu hydro đại diện cho các dự đoán chất lượng cao thực sự.
Mô hình cũng vượt trội hơn về tính nhất quán khi dự đoán các mẫu tách đỉnh và giá trị J-coupling, hai đặc điểm mà các nhà hóa học dựa vào nhiều để phân biệt giữa các cấu trúc phân tử tương tự.
Ở khía cạnh ngược lại, nơi mô hình phải suy ra cấu trúc từ dữ liệu NMR một chiều và phổ khối độ phân giải cao, Opus 4.7 đã khôi phục thành công tất cả các cấu trúc mục tiêu đơn giản trong mọi lần thử. Khi nhóm thêm các manh mối từ nguyên liệu ban đầu cho các mục tiêu phức tạp hơn, mô hình đã thành công với bốn trong số bảy cấu trúc dày đặc hơn trong tất cả các lần chạy.
Tại sao điều này lại khác với các bài kiểm tra AI thông thường
Điều làm cho kết quả của Anthropic trở nên bất thường là Opus 4.7 không được tinh chỉnh trên dữ liệu chuyên về hóa học cho nhiệm vụ này. Nó hoạt động trên các kết quả đọc do nhà hóa học dán vào mà không cần thiết lập chuyên biệt. Bằng tiếng Anh: một nhà hóa học có thể sao chép dữ liệu NMR của họ vào cửa sổ trò chuyện và nhận được đề xuất cấu trúc, không cần giấy phép phần mềm độc quyền.
Nghiên cứu cũng đặc biệt không yêu cầu dữ liệu NMR 2D, vốn thường được coi là thiết yếu để xác định cấu trúc phức tạp. Các thí nghiệm NMR hai chiều mất nhiều thời gian hơn để thực hiện và tạo ra nhiều dữ liệu hơn để phân tích. Việc bỏ qua yêu cầu này, ngay cả đối với các hợp chất đơn giản hơn, đã tối ưu hóa quy trình làm việc vốn vẫn chưa thay đổi đáng kể trong nhiều thập kỷ.
