Google Research muốn AI bắt đầu nói nhiều hơn rằng “Tôi không chắc”. Một bài báo từ các nhà nghiên cứu của công ty lập luận rằng các mô hình ngôn ngữ lớn nên thận trọng trong câu trả lời khi mức độ tự tin nội tại thấp, thay vì đưa ra mọi câu trả lời với sự tự tin không xứng đáng như thể họ hoàn toàn không vừa bịa ra điều gì đó.
Bài báo có tựa đề “Liệu Các Mô hình Ngôn ngữ Lớn có thể Biểu đạt Chính xác Sự Không chắc chắn Bẩm sinh của Chúng Bằng Từ ngữ Không?” đã được trình bày tại EMNLP 2024, một trong những diễn đàn hàng đầu về nghiên cứu xử lý ngôn ngữ tự nhiên. Kết luận cốt lõi của nó: các mô hình ngôn ngữ lớn hiện tại cực kỳ kém trong việc thông báo cho bạn khi chúng thực sự không biết mình đang nói về điều gì.
Khoảng cách giữa việc biết và nói
Các tác giả Gal Yona, Roee Aharoni và Mor Geva đề xuất một khung lý thuyết chính thức mà họ gọi là “sự không chắc chắn trong phản hồi trung thực.” Bằng tiếng Anh: một cách đo lường liệu mức độ tự tin mà mô hình thể hiện có thực sự phù hợp với mức độ tự tin nội tại của nó hay không. Chỉ số này phạt cả hai chiều của sự không khớp, vì vậy một mô hình luôn do dự sẽ bị phạt không kém gì một mô hình không bao giờ do dự.
Khuyến nghị của họ rất đơn giản nhưng gây hiểu lầm. Khi mức độ tự tin nội tại của LLM thấp, nó nên sử dụng các cụm từ làm mềm trong ngôn ngữ tự nhiên như “Tôi không chắc, nhưng…” thay vì trình bày thông tin không chắc chắn như sự thật.
Các nhà nghiên cứu đã kiểm tra nhiều mô hình LLM được căn chỉnh trên các nhiệm vụ trả lời câu hỏi đòi hỏi nhiều kiến thức. Kết quả không hề tích cực. Các mô hình hiện đại gặp khó khăn đáng kể trong việc phản ánh chính xác mức độ không chắc chắn của chính chúng trong các đầu ra.
Tại sao ảo tưởng lại quan trọng hơn cả các chatbot
Bài báo của Google xem việc biểu đạt sự không chắc chắn như một vấn đề về sự đồng bộ. Các kỹ thuật đồng bộ hiện tại, các quy trình được sử dụng để tinh chỉnh mô hình sau giai đoạn huấn luyện ban đầu, thường tối ưu hóa cho sự hữu ích và trôi chảy. Một mô hình trả lời “Tôi không biết” sẽ có điểm thấp trên các tiêu chí đánh giá sự hữu ích, ngay cả khi “Tôi không biết” là câu trả lời chính xác nhất có thể.
Điều này tạo ra một động lực lệch lạc. Các mô hình học trong quá trình căn chỉnh rằng những câu trả lời tự tin, chi tiết sẽ được thưởng, trong khi những câu trả lời dè dặt hoặc không đầy đủ sẽ bị phạt. Các nhà nghiên cứu lập luận rằng khoảng cách này đòi hỏi các kỹ thuật căn chỉnh mới được thiết kế đặc biệt để điều chỉnh mức độ chắc chắn được thể hiện với kiến thức thực tế.
Bản preprint trên arXiv đã được công bố lần đầu vào ngày 27 tháng 5 năm 2024, giúp cộng đồng nghiên cứu rộng rãi có nhiều tháng để tìm hiểu các phát hiện trước khi trình bày tại EMNLP.
Điều này có nghĩa gì đối với tiền điện tử và giao dịch dựa trên AI
Bản giấy không chứa bất kỳ tham chiếu nào đến tiền điện tử, tài sản kỹ thuật số hoặc các ứng dụng tài chính. Nhưng những hệ quả của nó lan tỏa ra ngoài theo những cách có ý nghĩa đối với bất kỳ ai sử dụng công cụ AI trong bối cảnh đầu tư.
Một tín hiệu giao dịch cho rằng “Bitcoin sẽ kiểm tra mức kháng cự tại $X” mang những hàm ý rất khác nhau tùy thuộc vào việc mô hình cơ sở có độ tin cậy 95% hay 45%. Hiện tại, hầu hết các công cụ dựa trên AI đều trình bày cả hai kịch bản giống nhau.
Đối với các nhà đầu tư và trader hiện đang dựa vào các công cụ AI để phân tích tiền điện tử, bài học thực tế rất đơn giản: hãy coi bất kỳ nhận định nào do AI tạo ra mà không thể hiện sự không chắc chắn của chính nó là chưa đầy đủ, nếu không muốn nói là thiếu chính xác. Bài báo của Google cho thấy ngay cả những mô hình tinh vi nhất cũng thường xuyên thổi phồng sự tự tin của mình.
