Vấn đề chưa được giải quyết lớn nhất trong AI có thể không phải là sự phù hợp hay ảo giác. Mà là đánh giá. ⚠️ Chúng ta vẫn chưa có cách đo lường đáng tin cậy để xác định liệu các mô hình có thực sự trở nên thông minh hơn — hay chỉ đang ngày càng giỏi hơn trong các bài kiểm tra chuẩn. Luật Goodhart: “Khi một thước đo trở thành mục tiêu, nó ngừng là một thước đo tốt.” Các phòng thí nghiệm tối ưu hóa cho: ↳ MMLU ↳ HumanEval ↳ MATH Các mô hình đều vượt qua chúng. 🏆 Nhưng trí thông minh thực tế thì phức tạp hơn nhiều: ↳ Lý luận dài hạn ↳ Các nhiệm vụ mở ↳ Môi trường chưa từng thấy ↳ Tương tác thực tế với con người Chúng ta có thể đang tự đánh lừa mình bằng cách đo lường một cách sai lệch. 🧠 #AI #Edu3Labs

Chia sẻ







Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.