TL;DR:
- Arbitrum đang nghiên cứu một phương pháp xác minh suy luận AI mới giúp giảm thời gian tạo bằng chứng từ 15 phút xuống miligiây.
- Một bài báo của Offchain Labs đề xuất xác minh các suy luận của mô hình AI thông qua việc lấy mẫu ngẫu nhiên các đường đi nội bộ, mà không cần thực thi lại mọi thao tác.
- Giao thức sử dụng cùng logic giải quyết tranh chấp như Arbitrum One để phát hiện sự thay thế mô hình trong các API AI.
Nền kinh tế của các tác nhân trí tuệ nhân tạo đang đối mặt với một vấn đề mà cho đến nay chưa ai giải quyết được với tốc độ đủ nhanh để áp dụng trong sản xuất: xác minh rằng mô hình AI mà nhà cung cấp tuyên bố đang chạy thực sự là mô hình đang được thực thi.
Một bài báo được xuất bản vào tháng 3 năm 2026 bởi Offchain Labs, có tựa đề *Towards Verifiable AI with Lightweight Cryptographic Proofs of Inference*, đề xuất một giải pháp giảm thời gian tạo chứng minh từ khoảng 15 phút xuống miligiây, và logic đằng sau hệ thống này không xa lạ với hệ sinh thái Arbitrum.
Một khoảng cách niềm tin mà thị trường đã chuẩn hóa
Mô hình định giá theo từng token tạo ra động cơ kinh tế rõ ràng cho gian lận. Việc phục vụ mô hình 7 tỷ tham số rẻ hơn so với mô hình 70 tỷ tham số, và chi phí thực hiện suy luận lượng tử thấp hơn so với độ chính xác đầy đủ. Nếu một nhà cung cấp có thể chuyển một phần nhỏ truy vấn sang mô hình nhỏ hơn trong khi vẫn thu phí của mô hình lớn hơn, lợi ích sẽ tăng theo khối lượng. Các nhà nghiên cứu tại Stanford đã ghi nhận rằng hành vi của GPT-3.5 và GPT-4 đã thay đổi theo cách có thể đo lường được giữa tháng Ba và tháng Sáu năm 2023 trên cùng các nhiệm vụ đánh giá. Hợp đồng API hiện tại không cung cấp cơ chế nào để phát hiện sự khác biệt đó.

Các bằng chứng mật mã hiện có, cùng loại được sử dụng bởi zk-rollups, có thể chứng minh rằng một máy chủ đã thực hiện một phép tính chính xác mà không cần khách hàng phải lặp lại nó. Vấn đề là tốc độ. Các sơ đồ như zkLLM tạo bằng chứng suy luận cho một mô hình 13 tỷ tham số trong khoảng 15 phút, một con số không tương thích với các API phải phản hồi trong dưới một giây.
Cơ chế giống nhau bảo vệ Arbitrum One
Đề xuất của Offchain Labs từ bỏ bằng chứng toàn diện và áp dụng lấy mẫu. Máy chủ cam kết trước về dấu vân tay kỹ thuật số của trọng số mô hình và các giá trị nội bộ được tạo ra trong quá trình truy vấn cụ thể. Sau đó, khách hàng chọn một đường dẫn ngẫu nhiên hướng tới đầu ra của mạng và yêu cầu máy chủ chỉ tiết lộ các giá trị dọc theo đường dẫn đó. Nếu máy chủ chạy một mô hình khác, các giá trị sẽ không nhất quán và việc xác minh sẽ thất bại. Xác suất phát hiện tích lũy với mỗi truy vấn lặp lại, biến hệ thống thành một biện pháp răn đe hiệu quả đối với các đối thủ hợp lý.

Mối liên hệ với Arbitrum được nêu rõ trong bài báo. Các optimistic rollups hoạt động dựa trên cùng một suy luận: việc tái thực thi từng bước của một phép tính dài trên mọi máy là tốn kém, trong khi việc lấy mẫu bước gây tranh chấp lại rẻ. Giao thức được đề xuất mở rộng logic này sang các giá trị mạng nơ-ron, sử dụng thủ tục chia đôi để thu hẹp sự bất đồng giữa hai máy chủ trong một số vòng logarithmic, cùng cấu trúc giải quyết tranh chấp bảo vệ Arbitrum One.
Đối với các ngành được quản lý, các nhóm quản trị mô hình và thị trường đang nổi lên của các tác nhân tự chủ, sự khác biệt giữa một tuyên bố về tính minh bạch và một tuyên bố có thể xác minh đang bắt đầu mang lại những hệ quả trực tiếp. Giao thức không yêu cầu các nhà phát triển phải sửa đổi các stack hiện có của họ; nó chỉ yêu cầu một người nào đó trong hệ thống, dù là nhà cung cấp, người kiểm toán hay nền tảng, tạo ra một tuyên bố có thể xác minh.

