Anthropic, công ty đứng sau mô hình AI Claude, đã đăng một bài viết trên blog vào ngày 4 tháng 6 đề xuất một điều từng nghe có vẻ không thể tưởng tượng từ một phòng thí nghiệm AI hàng đầu cách đây một năm: một sự tạm dừng có cấu trúc và có thời hạn đối với việc phát triển AI tiên tiến trên toàn ngành.
Đề xuất do Marina Favaro và Jack Clark soạn thảo nhắm vào một vấn đề cụ thể và thực sự đáng lo ngại. Các mô hình AI đang tiến gần đến khả năng tự cải tiến lặp lại, nghĩa là chúng có thể tự sửa đổi và nâng cao khả năng của chính mình mà không cần sự can thiệp của con người.
Điều mà Anthropic thực sự đề xuất
Đây không phải là lời kêu gọi ngắt kết nối mọi GPU và về nhà. Anthropic đang ủng hộ một khung khổ phối hợp, đa phương, nơi các phòng thí nghiệm AI lớn đồng ý tạm dừng các công việc phát triển tiên tiến nhất trong khi các hệ thống nghiên cứu an toàn và xác minh bắt kịp.
Anthropic lập luận rõ ràng rằng các hành động đơn phương, trong đó một công ty hoặc một quốc gia đơn độc phanh lại, là không đủ và có thể phản tác dụng. Đề xuất này hình dung sự hợp tác giữa các phòng thí nghiệm có nguồn lực dồi dào tại Mỹ, Trung Quốc và các quốc gia khác có chương trình AI nghiêm túc. Anthropic đang định nghĩa thách thức xác minh theo cách lấy cảm hứng từ kiểm soát vũ khí hạt nhân, nơi các thanh tra xác minh sự tuân thủ thông qua các cơ chế phát hiện đã thống nhất, thay vì dựa vào niềm tin đơn thuần.
Anthropic cho biết sẽ tiến hành nghiên cứu riêng để xây dựng các công cụ phát hiện và xác minh này, tạo ra hệ thống tương đương với các thanh tra vũ khí AI — những hệ thống có thể xác nhận liệu một phòng thí nghiệm có đang tiếp tục phát triển frontier một cách bí mật trong khi công khai tuyên bố tuân thủ lệnh tạm dừng hay không.
Tại sao lần này có thể khác với năm 2023
Năm 2023, một bức thư mở kêu gọi tạm dừng sáu tháng việc đào tạo AI vượt quá mức GPT-4 đã thu hút hàng nghìn chữ ký từ các nhà nghiên cứu và những nhân vật nổi bật trong ngành công nghệ. Tuy nhiên, nó gần như không mang lại kết quả gì. Áp lực cạnh tranh đã chứng minh tính thuyết phục vượt trội so với nỗi lo ngại tập thể, và mọi phòng thí nghiệm lớn đều tiếp tục phát triển.
Đề xuất của Anthropic có cấu trúc khác biệt. Thay vì yêu cầu một lệnh đình chỉ mơ hồ được hỗ trợ bởi các chữ ký, công ty đang đề xuất một hệ thống tuân thủ có thể xác minh. So sánh với kiểm soát vũ khí hạt nhân không hoàn toàn sai: các hiệp ước vũ khí quốc tế hoạt động, khi chúng hoạt động, nhờ vào các cơ chế thanh tra và hậu quả đối với hành vi gian lận, chứ không phải vì các bên ký kết hứa hẹn bằng ngón tay út.
Năm 2023, tự cải tiến lặp lại là một mối quan tâm mang tính lý thuyết. Hiện nay, các quan sát nội bộ của Anthropic cho thấy các mô hình hiện tại ngày càng có khả năng lập trình một cách tự chủ, tiến gần hơn đến ngưỡng mà một hệ thống AI có thể đóng góp đáng kể vào phiên bản tiếp theo của chính nó.
Điều này có nghĩa gì đối với các nhà đầu tư
Đối với bất kỳ ai có tiền đầu tư vào các tài sản liên quan đến AI, bao gồm các token crypto tập trung vào AI và các dự án blockchain sử dụng học máy, đề xuất của Anthropic đã đưa ra một biến số mới vào phép tính rủi ro. Một khung tạm dừng phối hợp, ngay cả khi không bao giờ được thực hiện đầy đủ, cũng đã thay đổi cuộc thảo luận từ “chúng ta có nên điều tiết AI không” sang “chúng ta làm thế nào để thực thi tuân thủ xuyên biên giới.”
Các dự án tiền điện tử do AI dẫn dắt, từ các mạng tính toán phi tập trung đến các token đại diện AI, có một phần giá trị đến từ giả định rằng sự phát triển của AI sẽ tiếp tục tăng tốc không gián đoạn. Một khung dừng lại đáng tin cậy, hoặc thậm chí là các động thái quản lý nghiêm túc theo hướng đó, có thể tạo ra sự không chắc chắn trong các định giá này.
Các hệ thống xác minh phi tập trung có thể trở thành một phần trong giải pháp mà Anthropic đang tìm kiếm. Nếu bạn cần xác minh rằng các phòng thí nghiệm trên toàn thế giới đang tuân thủ các giới hạn phát triển, một sổ cái minh bạch và chống thao túng không phải là công cụ tệ nhất để thực hiện nhiệm vụ này.
