Anthropic đã phát hành mô hình công khai mới nhất Opus 4.8 và đồng thời ra mắt bản xem trước tính năng mới có tên “Dynamic Workflows”. Phiên bản mới này chỉ cách Opus 4.7 đúng 41 ngày, cho thấy tốc độ cập nhật đã rõ ràng nhanh hơn, đồng thời phản ánh sự gia tăng cạnh tranh giữa các nhà phát triển mô hình lớn trong quá trình lặp lại sản phẩm.
Cập nhật một lần sau 41 ngày
Opus 4.8 là mô hình công khai tiên tiến nhất hiện nay của Anthropic, với mức giá giữ nguyên như phiên bản Opus thế hệ trước. So với trước đây, lần nâng cấp này có khoảng cách ngắn hơn. Để so sánh, các loạt Sonnet và Haiku gần đây của Anthropic đã cách lần cập nhật trước khoảng 3 tháng và 7 tháng.
Trong khoảng thời gian này, OpenAI đã ra mắt các bản cập nhật liên quan đến Codex, đồng thời Google cũng công bố phiên bản mới của Gemini Flash. Sau khi cạnh tranh từ bên ngoài gia tăng, Anthropic cần nhanh chóng đưa ra sản phẩm mới để đáp ứng thị trường.
Nhấn mạnh việc giảm thiểu các kết luận không có cơ sở
Theo Anthropic, Opus 4.8 vẫn duy trì hiệu suất dẫn đầu trong các bài kiểm tra chuẩn, nhưng sự thay đổi nổi bật lần này là cách mô hình xử lý dữ liệu sai lệch hoặc không chắc chắn. Trong thông báo phát hành, công ty cho biết các người dùng thử nghiệm sớm nhận thấy Opus 4.8 có xu hướng chủ động ghi nhận các điểm không chắc chắn và ít đưa ra các phán đoán thiếu cơ sở hơn.
Bridgewater cũng được nhắc đến trong đánh giá của người dùng rằng phiên bản mới dễ dàng hơn trong việc chủ động chỉ ra các vấn đề trong đầu vào và đầu ra của phân tích, trong khi những vấn đề này trước đây thường cần người dùng tự phát hiện.
Chế độ làm việc động đã vào bản xem trước
Cùng với mô hình mới, Dynamic Workflows đang ở giai đoạn nghiên cứu sơ bộ cũng đã được ra mắt. Hệ thống này chủ yếu hướng đến việc thực hiện các tác vụ phức tạp hơn, nhằm giúp các mô hình lớn như Opus điều phối hàng trăm đại lý song song để hoàn thành các công việc quy mô lớn, nhiều bước.
Anthropic cho biết, khi Claude Code kết hợp với Opus 4.8, có thể thực hiện nhiệm vụ di chuyển lên đến hàng trăm nghìn dòng mã, bao quanh hệ thống kiểm thử hiện tại, từ khởi động đến hợp nhất thành một quy trình hoàn chỉnh hơn.
Mythos vẫn chưa được mở rộng đầy đủ
Anthropic hiện vẫn chưa chính thức ra mắt mô hình Mythos cấp cao hơn. Mô hình này sau khi được giới thiệu ngắn gọn vào tháng trước đã gây ra những lo ngại về an ninh mạng.
Tuy nhiên, trong đợt phát hành Opus 4.8 này, công ty cho biết các biện pháp bảo mật liên quan đang được đẩy nhanh và dự kiến trong vài tuần tới sẽ mang các mô hình cấp Mythos đến nhiều khách hàng hơn.
