Bài báo nghiên cứu của Google kêu gọi các mô hình LLM biểu đạt sự không chắc chắn tốt hơn

iconCryptoBriefing
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Google Research đã công bố một bài báo kêu gọi các mô hình ngôn ngữ lớn biểu đạt sự không chắc chắn một cách chính xác hơn trong các câu trả lời của chúng. Nghiên cứu, được trình bày tại EMNLP 2024, lập luận rằng các mô hình hiện tại thường thể hiện sự tự tin quá mức so với thực tế, điều này có thể ảnh hưởng đến niềm tin của thị trường vào các quyết định do AI đưa ra. Các nhà nghiên cứu đề xuất sử dụng ngôn ngữ thận trọng để điều chỉnh mức độ tự tin được thể hiện với mức độ chắc chắn nội tại. Kết quả nghiên cứu có thể tác động đến các altcoin cần theo dõi, đặc biệt là những đồng liên quan đến các nền tảng giao dịch do AI điều khiển. Bài báo cảnh báo rằng sự tự tin quá mức vào tín hiệu AI có thể dẫn dắt nhà đầu tư sai lầm.

Google Research muốn AI bắt đầu nói nhiều hơn rằng “Tôi không chắc”. Một bài báo từ các nhà nghiên cứu của công ty lập luận rằng các mô hình ngôn ngữ lớn nên thận trọng trong câu trả lời khi mức độ tự tin nội tại thấp, thay vì đưa ra mọi câu trả lời với sự tự tin không xứng đáng như thể họ hoàn toàn không vừa bịa ra điều gì đó.

Bài báo có tựa đề “Liệu Các Mô hình Ngôn ngữ Lớn có thể Biểu đạt Chính xác Sự Không chắc chắn Bẩm sinh của Chúng Bằng Từ ngữ Không?” đã được trình bày tại EMNLP 2024, một trong những diễn đàn hàng đầu về nghiên cứu xử lý ngôn ngữ tự nhiên. Kết luận cốt lõi của nó: các mô hình ngôn ngữ lớn hiện tại cực kỳ kém trong việc thông báo cho bạn khi chúng thực sự không biết mình đang nói về điều gì.

Khoảng cách giữa việc biết và nói

Các tác giả Gal Yona, Roee Aharoni và Mor Geva đề xuất một khung lý thuyết chính thức mà họ gọi là “sự không chắc chắn trong phản hồi trung thực.” Bằng tiếng Anh: một cách đo lường liệu mức độ tự tin mà mô hình thể hiện có thực sự phù hợp với mức độ tự tin nội tại của nó hay không. Chỉ số này phạt cả hai chiều của sự không khớp, vì vậy một mô hình luôn do dự sẽ bị phạt không kém gì một mô hình không bao giờ do dự.

Khuyến nghị của họ rất đơn giản nhưng gây hiểu lầm. Khi mức độ tự tin nội tại của LLM thấp, nó nên sử dụng các cụm từ làm mềm trong ngôn ngữ tự nhiên như “Tôi không chắc, nhưng…” thay vì trình bày thông tin không chắc chắn như sự thật.

Quảng cáo

Các nhà nghiên cứu đã kiểm tra nhiều mô hình LLM được căn chỉnh trên các nhiệm vụ trả lời câu hỏi đòi hỏi nhiều kiến thức. Kết quả không hề tích cực. Các mô hình hiện đại gặp khó khăn đáng kể trong việc phản ánh chính xác mức độ không chắc chắn của chính chúng trong các đầu ra.

Tại sao ảo tưởng lại quan trọng hơn cả các chatbot

Bài báo của Google xem việc biểu đạt sự không chắc chắn như một vấn đề về sự đồng bộ. Các kỹ thuật đồng bộ hiện tại, các quy trình được sử dụng để tinh chỉnh mô hình sau giai đoạn huấn luyện ban đầu, thường tối ưu hóa cho sự hữu ích và trôi chảy. Một mô hình trả lời “Tôi không biết” sẽ có điểm thấp trên các tiêu chí đánh giá sự hữu ích, ngay cả khi “Tôi không biết” là câu trả lời chính xác nhất có thể.

Điều này tạo ra một động lực lệch lạc. Các mô hình học trong quá trình căn chỉnh rằng những câu trả lời tự tin, chi tiết sẽ được thưởng, trong khi những câu trả lời dè dặt hoặc không đầy đủ sẽ bị phạt. Các nhà nghiên cứu lập luận rằng khoảng cách này đòi hỏi các kỹ thuật căn chỉnh mới được thiết kế đặc biệt để điều chỉnh mức độ chắc chắn được thể hiện với kiến thức thực tế.

Bản preprint trên arXiv đã được công bố lần đầu vào ngày 27 tháng 5 năm 2024, giúp cộng đồng nghiên cứu rộng rãi có nhiều tháng để tìm hiểu các phát hiện trước khi trình bày tại EMNLP.

Điều này có nghĩa gì đối với tiền điện tử và giao dịch dựa trên AI

Bản giấy không chứa bất kỳ tham chiếu nào đến tiền điện tử, tài sản kỹ thuật số hoặc các ứng dụng tài chính. Nhưng những hệ quả của nó lan tỏa ra ngoài theo những cách có ý nghĩa đối với bất kỳ ai sử dụng công cụ AI trong bối cảnh đầu tư.

Một tín hiệu giao dịch cho rằng “Bitcoin sẽ kiểm tra mức kháng cự tại $X” mang những hàm ý rất khác nhau tùy thuộc vào việc mô hình cơ sở có độ tin cậy 95% hay 45%. Hiện tại, hầu hết các công cụ dựa trên AI đều trình bày cả hai kịch bản giống nhau.

Đối với các nhà đầu tư và trader hiện đang dựa vào các công cụ AI để phân tích tiền điện tử, bài học thực tế rất đơn giản: hãy coi bất kỳ nhận định nào do AI tạo ra mà không thể hiện sự không chắc chắn của chính nó là chưa đầy đủ, nếu không muốn nói là thiếu chính xác. Bài báo của Google cho thấy ngay cả những mô hình tinh vi nhất cũng thường xuyên thổi phồng sự tự tin của mình.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.