Odaily Planet Daily báo cáo, CISO của SlowMist, 23pads, đã đăng bài trên nền tảng X cho biết, bài kiểm tra hiệu năng PinchBench đánh giá hiệu suất của các mô hình ngôn ngữ lớn AI trong nhiệm vụ đại diện OpenClaw, kết quả cho thấy Gemini 3 Flash đạt tỷ lệ thành công 95,1% trong các nhiệm vụ OpenClaw, dẫn đầu, tiếp theo là minimax-m2.1 và kimi-k2.5 với lần lượt 93,6% và 93,4%. Claude Sonnet 4.5 đạt 92,7%, trong khi GPT-4o đạt 85,2%.
Bài kiểm tra PinchBench: Gemini 3 Flash dẫn đầu các mô hình AI với tỷ lệ thành công 95,1% trong các nhiệm vụ OpenClaw
KuCoinFlashChia sẻ






Thanh khoản và thị trường tiền điện tử đã ghi nhận một chuẩn mực mới khi Gemini 3 Flash đạt thành tích cao nhất trong bài kiểm tra PinchBench với tỷ lệ thành công 95,1% trong các nhiệm vụ OpenClaw. Minimax-m2.1 và Kimi-k2.5 lần lượt đứng sau với 93,6% và 93,4%. Claude Sonnet 4.5 và GPT-4o đạt điểm 92,7% và 85,2%. Bài kiểm tra tập trung vào hiệu suất thực tế của các tác nhân. Các cơ quan quản lý theo dõi tuân thủ CFT có thể theo dõi các chỉ số này để tăng tính minh bạch.
Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.