- Anthropic đã khôi phục Fable 5 trên toàn cầu sau khi các biện pháp kiểm soát xuất khẩu của Hoa Kỳ kết thúc vào ngày 30 tháng Sáu.
- Các biện pháp bảo vệ mới hiện đã chặn việc vượt qua được báo cáo trong hơn 99% các trường hợp đã kiểm tra.
- Anthropic và các đối tác của Project Glasswing đang xây dựng một khung chung để đánh giá các cuộc tấn công bẻ khóa AI.
Anthropic đã khôi phục quyền truy cập toàn cầu vào mô hình Claude Fable 5 sau khi chính phủ Hoa Kỳ gỡ bỏ các biện pháp kiểm soát xuất khẩu từng hạn chế tạm thời khả năng sử dụng. Công ty cho biết các biện pháp kiểm soát này, được áp dụng vào ngày 12 tháng Sáu, yêu cầu họ tạm dừng truy cập vì không thể xác minh ngay lập tức quốc tịch của người dùng trong thời gian thực.
Với các hạn chế được gỡ bỏ kể từ ngày 30 tháng Sáu, Fable 5 hiện đã có sẵn trên toàn bộ Nền tảng Claude, Claude.ai, Claude Code và Claude Cowork, trong khi việc truy cập Mythos 5 đã được khôi phục cho một nhóm hạn chế các tổ chức Hoa Kỳ được phê duyệt.
Bên cạnh việc khôi phục, Anthropic đã chi tiết các biện pháp bảo mật mạng mới, nêu kế hoạch xây dựng khung ngành chung về các cuộc tấn công jailbreak AI, và mô tả sự hợp tác mở rộng với các cơ quan chính phủ Hoa Kỳ.
Các biện pháp kiểm soát xuất khẩu được gỡ bỏ sau hai tuần tạm dừng
Anthropic said Fable 5 và Mythos 5 đã ra mắt vào ngày 9 tháng 6 sử dụng cùng một mô hình cơ sở, mặc dù mỗi mô hình được thiết kế cho các mục đích khác nhau. Fable 5 được phát hành với các biện pháp bảo mật mạng mạnh mẽ hơn dành cho người dùng phổ thông, trong khi Mythos 5 chỉ được cung cấp cho các đối tác được chọn của Dự án Glasswing đang làm việc về an ninh mạng phòng thủ.
Các biện pháp kiểm soát xuất khẩu được thực hiện sau một báo cáo mô tả một phương pháp vượt qua một số biện pháp bảo vệ của Fable 5. Theo Anthropic, các bài kiểm tra được thực hiện cùng với các cơ quan chính phủ và đối tác cho thấy rằng một số mô hình AI khác có thể xác định cùng các lỗ hổng phần mềm được đề cập trong báo cáo, và mỗi mô hình được kiểm tra cũng có khả năng tạo ra cùng bản trình diễn khai thác một lỗ hổng duy nhất.
Anthropic cho biết hành vi được báo cáo không phơi bày các khả năng độc đáo của Mythos 5 mà thay vào đó liên quan đến một nhiệm vụ an ninh mạng đã bị chặn như một phần trong các biện pháp phòng ngừa của Fable 5’s.
Các biện pháp bảo vệ mới và sự phối hợp trong ngành
Để giải quyết lỗ hổng được báo cáo, Anthropic đã giới thiệu bộ phân loại an toàn được cập nhật, ngăn chặn kỹ thuật được xác định trong hơn 99% trường hợp thử nghiệm. Khi các yêu cầu bị chặn, người dùng sẽ được chuyển hướng đến Claude Opus 4.8. Công ty cũng cho biết hệ thống cập nhật có thể làm tăng số lượng kết quả dương tính giả trong các tác vụ lập trình và gỡ lỗi thông thường trong khi các cải tiến thêm tiếp tục được thực hiện.
Đồng thời, Anthropic cho biết họ đang hợp tác với Amazon, Microsoft, Google và các đối tác khác của Dự án Glasswing để phát triển một khung đánh giá chung cho các cuộc tấn công bẻ khóa AI. Hệ thống đề xuất sẽ đánh giá các cuộc tấn công bẻ khóa dựa trên mức độ tăng khả năng, phạm vi khả năng, mức độ dễ dàng vũ khí hóa và khả năng phát hiện để xác định mức độ nghiêm trọng của các kỹ thuật mới được phát hiện.
Liên quan:Mỹ cho phép Mythos AI của Anthropic quay lại trực tuyến khi Trump đe dọa áp thuế 100%
Thông báo miễn trừ trách nhiệm: Thông tin được trình bày trong bài viết này chỉ mang tính chất tham khảo và giáo dục. Bài viết không cấu thành lời khuyên tài chính hay bất kỳ loại lời khuyên nào khác. Coin Edition không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh do việc sử dụng nội dung, sản phẩm hoặc dịch vụ được đề cập. Độc giả được khuyến nghị thận trọng trước khi thực hiện bất kỳ hành động nào liên quan đến công ty.
