Epoch AI phát hành báo cáo đánh giá các mô hình dòng Claude Mythos, chỉ ra rằng Mythos Preview dẫn trước xu hướng tuyến tính khoảng 7 tháng trong phát triển khai thác lỗ hổng, vượt trội hơn OpenAI GPT-5.5 khoảng 3 tháng. Báo cáo cho rằng lợi thế của Mythos trong phát hiện lỗ hổng bị thổi phồng, vì hiệu suất của nó trong bài kiểm tra curl không vượt quá các công cụ truyền thống, và sự gia tăng đột biến trong báo cáo CVE từ tháng 4 đến tháng 5 chủ yếu do Anthropic cung cấp 100 triệu USD hạn mức API cho Glasswing. Lợi thế thực sự của Mythos nằm ở tỷ lệ báo lỗi thấp và phân loại mức độ nguy hiểm chính xác.
Báo cáo Epoch AI: Claude Mythos dẫn đầu trong phát triển khai thác nhưng đánh giá quá cao lợi thế phát hiện lỗ hổng
AiCoinChia sẻ
Báo cáo thị trường hàng tuần mới nhất của Epoch AI nhấn mạnh Claude Mythos là một trong những sản phẩm dẫn đầu trong phát triển khai thác, dẫn trước các xu hướng tuyến tính tới bảy tháng và vượt trội hơn GPT-5.5 ba tháng. Tuy nhiên, báo cáo thị trường hàng ngày ghi nhận Mythos hoạt động kém trong việc phát hiện lỗ hổng, không vượt qua được các công cụ truyền thống trong các bài kiểm tra curl. Một hạn mức API trị giá 100 triệu USD từ Anthropic dành cho Glasswing đã thúc đẩy sự gia tăng đột biến trong các báo cáo CVE vào tháng Tư-Tháng Năm. Mythos nổi bật ở mức false positives thấp và phân loại rủi ro chính xác.
Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.