Anthropic cho biết thế giới nên có lựa chọn làm chậm hoặc tạm dừng phát triển AI tiên tiến nếu các phòng thí nghiệm AI hàng đầu và chính phủ có thể tạo ra một cách xác minh đáng tin cậy để đảm bảo mọi người đều tuân thủ.
Trong một báo cáo mới từ Viện Anthropic, công ty cho biết việc tạm dừng có thể giúp các nhà hoạch định chính sách, các nhà nghiên cứu và xã hội dân sự có thêm thời gian để giải quyết các rủi ro liên quan đến các hệ thống AI ngày càng mạnh mẽ. Tuy nhiên, công ty cảnh báo rằng việc giảm tốc độ chỉ cải thiện an toàn nếu nó được áp dụng đồng thời tại nhiều phòng thí nghiệm được đầu tư tốt, ở hoặc gần ranh giới前沿.
Anthropic cho biết việc một công ty đơn phương tạm dừng sẽ dễ thực hiện hơn nhưng hiệu quả kém hơn nhiều, vì nó có thể đơn giản là nhường lợi thế cho những bên ít cẩn trọng hơn. Công ty cho biết bất kỳ sự tạm dừng nào có ý nghĩa đều yêu cầu các nhà phát triển ở nhiều quốc gia ngừng hoạt động dưới cùng một điều kiện và xác minh rằng các đối thủ cạnh tranh cũng đã ngừng.
Cảnh báo này được đưa ra khi Anthropic cho biết các hệ thống AI đã và đang thúc đẩy sự phát triển của các mô hình AI mới. Tính đến tháng 5 năm 2026, hơn 80% mã được hợp nhất vào cơ sở mã của Anthropic được viết bởi Claude, tăng từ mức số ít trước khi Claude Code ra mắt ở phiên bản thử nghiệm nghiên cứu vào tháng 2 năm 2025.
Công ty cho biết kỹ sư điển hình của Anthropic đã hợp nhất số mã nhiều gấp tám lần mỗi ngày trong quý hai năm 2026 so với năm 2024. Một cuộc khảo sát nội bộ tháng 3 năm 2026 cũng cho thấy các nhân viên nghiên cứu sử dụng Mythos Preview ước tính họ đang tạo ra lượng đầu ra nhiều gấp bốn lần so với khi không sử dụng các mô hình AI.
Anthropic cho biết những tiến bộ này cho thấy một sự thay đổi rộng hơn trong cách các hệ thống AI tiên tiến được xây dựng. Các kỹ sư và nhà nghiên cứu con người vẫn đang đặt ra mục tiêu, xem xét đầu ra và quyết định những vấn đề nào quan trọng, nhưng Claude đang đảm nhận nhiều hơn công việc thực thi trong lập trình, kiểm thử, gỡ lỗi và tối ưu hóa thí nghiệm.
Công ty mô tả xu hướng này là một bước đầu tiên hướng tới việc tự cải tiến lặp lại, một kịch bản trong đó các hệ thống AI trở nên có khả năng tự thiết kế và phát triển những người kế nhiệm của chính chúng. Anthropic cho biết hệ thống như vậy hiện chưa tồn tại và có thể không phải là điều tất yếu, nhưng cảnh báo rằng nó có thể xuất hiện sớm hơn hầu hết các tổ chức sẵn sàng đón nhận.
Nếu điều đó xảy ra, Anthropic cho biết tốc độ phát triển AI có thể trở nên gắn chặt hơn với khả năng và hiệu quả tính toán, trong khi con người chuyển sang vai trò giám sát, xác thực và kiểm chứng. Điều đó sẽ làm cho các hệ thống được sử dụng để giám sát sự phát triển của AI tiên tiến trở nên quan trọng hơn, đặc biệt nếu các mô hình AI bắt đầu đóng vai trò lớn hơn trong việc xây dựng các phiên bản tương lai của chính chúng.
Anthropic cho biết thách thức là việc xác minh việc tạm dừng phát triển AI khó hơn nhiều so với việc giám sát nhiều công nghệ khác. Các quá trình đào tạo có thể được che giấu, đầu vào của chúng mang tính đa năng, và động lực để âm thầm vi phạm sẽ cực kỳ lớn nếu một thực thể có thể giành lợi thế trong khi những người khác dừng lại.
Công ty cho biết một sự tạm dừng đáng tin cậy sẽ cần các quy tắc rõ ràng về những gì kích hoạt nó, những gì kết thúc nó và ai quyết định liệu các điều kiện đã được đáp ứng hay chưa. Công ty so sánh thách thức này với các chế độ kiểm soát vũ khí đối với các công nghệ phức tạp khác, đồng thời lưu ý rằng những hệ thống đó đã mất hàng thập kỷ để xây dựng và AI có thể không để lại cho các chính phủ nhiều thời gian như vậy.
Anthropic cho biết họ dự định tổ chức các cuộc hội thoại trong những tháng tới với các nhà hoạch định chính sách, nhà nghiên cứu, xã hội dân sự và các công ty AI khác để xem xét việc tự cải tiến lặp lại và các cơ chế phối hợp có thể có cho sự phát triển AI tiên tiến.
Công ty cho biết họ sẽ kỳ vọng làm chậm hoặc tạm dừng phát triển nếu các nhà phát triển frontier khác cũng làm như vậy theo cách có thể xác minh được.
