Một máy tính vừa giải được các bài toán toán học đã làm bế tắc con người trong nhiều thập kỷ. AlphaProof Nexus của Google DeepMind, một hệ thống kết hợp các mô hình ngôn ngữ lớn với trợ lý chứng minh hình thức Lean, đã tự động giải được 9 trong số 353 bài toán Erdős chưa được giải và chứng minh 44 trong số 492 giả thuyết chưa được giải từ Bách khoa toàn thư trực tuyến các dãy số nguyên (OEIS).
Chi phí mỗi vấn đề: vài trăm đô la. Những vấn đề này, trong một số trường hợp, đã chưa được giải quyết lâu hơn thời gian hầu hết những người đọc bài này đã sống.
AlphaProof Nexus thực sự làm gì
AlphaProof Nexus giải quyết vấn đề ảo giác của AI bằng cách kết hợp khả năng sinh tạo của mô hình AI với việc kiểm tra chứng minh chính thức thông qua công cụ chứng minh Lean. AI đề xuất một chứng minh, sau đó một hệ thống xác minh riêng biệt kiểm tra từng bước logic. Nếu chứng minh không vững chắc, nó sẽ bị từ chối.
Kết quả đã được ghi lại trong bản preprint arXiv (2605.22763v1) được công bố vào ngày 21 tháng 5 năm 2026. Tất cả các chứng minh chính thức và các phiên bản ngôn ngữ tự nhiên được chọn đã được công khai trong kho GitHub được cập nhật giữa ngày 20 và 22 tháng 5 năm 2026. Các ví dụ bài toán đã giải quyết bao gồm các biến thể #125, #138, #741 và #12 từ danh mục bài toán Erdős, với các chứng minh được chia sẻ thông qua các cuộc thảo luận trên erdosproblems.com.
Hệ thống sử dụng những “vòng lặp tác nhân” mà DeepMind gọi là, liên quan đến việc kiểm tra chứng minh, lặp lại và tinh chỉnh các chứng minh dựa trên trình kiểm tra chính thức cho đến khi chúng vượt qua hoặc hệ thống kết luận rằng nó không thể giải quyết vấn đề.
Một biến thể cơ bản của hệ thống cũng đã giải được 9 bài toán Erdős, nhưng với chi phí tính toán cao hơn, cho thấy kiến trúc Nexus đầy đủ hiệu quả hơn thay vì mạnh mẽ hơn về mặt thuần túy.
Tại sao các bài toán Erdős lại quan trọng
Paul Erdős là một trong những nhà toán học sản xuất nhất trong lịch sử, người đã đặt ra hàng trăm bài toán trong các lĩnh vực tổ hợp, lý thuyết số và lý thuyết đồ thị. Nhiều bài toán trong số đó đi kèm với phần thưởng tiền mặt do chính ông gắn vào.
Giải được 9 trong số 353 bài toán Erdős còn mở tương đương khoảng 2,5%. Mỗi bài toán đại diện cho một ranh giới của kiến thức toán học, nơi các nhà toán học chuyên nghiệp đã ít hoặc không có tiến triển, đôi khi trong nhiều thập kỷ.
Việc chứng minh 44 trong số 492 giả thuyết OEIS đang mở, khoảng 9%, cho thấy hệ thống có thể hoạt động trên nhiều lĩnh vực toán học khác nhau thay vì chỉ chuyên sâu vào một lĩnh vực hẹp.
AlphaProof Nexus được xây dựng dựa trên công trình trước đây của DeepMind với AlphaProof, vốn đạt hiệu suất cấp huy chương bạc tại Kỳ thi Toán học Quốc tế năm 2024. Sự tiến bộ từ trình giải bài toán Olympic sang trình chứng minh cấp nghiên cứu là đáng kể: các bài toán Olympic được thiết kế để có thể giải được trong vài giờ bởi những người tài năng, trong khi các bài toán nghiên cứu mở không đảm bảo điều đó.
Điều này có nghĩa gì đối với xác thực AI và tiền điện tử
AlphaProof Nexus không có kết nối trực tiếp nào với tiền điện tử, tài sản kỹ thuật số hoặc token. DeepMind đã phát triển nó nhằm phục vụ nghiên cứu toán học, với các ứng dụng dự kiến trong tổ hợp, hình học đại số và tối ưu hóa.
Công nghệ cốt lõi, xác minh hình thức dựa trên AI, nằm ở giao điểm của nhiều vấn đề mà ngành công nghiệp tiền mã hóa quan tâm. Việc kiểm toán hợp đồng thông minh, tạo bằng chứng không tri thức và xác minh giao thức mật mã đều dựa trên cùng một khả năng cơ bản: đảm bảo rằng các mệnh đề logic là đúng một cách có thể chứng minh được.
Xác minh chính thức là quá trình chứng minh toán học rằng phần mềm hoạt động như mong muốn. Trước đây, quá trình này tốn kém và chậm chạp, đòi hỏi chuyên gia con người có chuyên môn. Một hệ thống có thể tự động tạo và xác thực các chứng minh chính thức với chi phí chỉ vài trăm đô la Mỹ cho mỗi vấn đề đã thay đổi mô hình kinh tế của phương trình này.
Bằng chứng không tri thức, kỹ thuật mật mã nền tảng cho các blockchain tập trung vào quyền riêng tư và các giải pháp mở rộng lớp-2, yêu cầu cấu trúc toán học chặt chẽ. Lỗi trong thiết kế mạch ZK có thể làm tổn hại đến cả quyền riêng tư và bảo mật.
