Nghiên cứu cho thấy các công cụ ghi nhớ có thể làm giảm độ chính xác của mô hình AI

icon币界网
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Một nghiên cứu mới của công ty AI Writer cho thấy các công cụ ghi nhớ được thiết kế để lưu trữ sở thích người dùng có thể làm giảm độ chính xác của mô hình AI. Khi càng nhiều lịch sử người dùng được tích hợp, các mô hình trở nên bị ảnh hưởng nhiều hơn bởi các sở thích không liên quan và những hiểu lầm của người dùng, dẫn đến đầu ra ít mang tính thực tế hơn. Các bài kiểm tra cho thấy các mô hình ưu tiên các phản hồi phù hợp với người dùng thay vì độ chính xác, đặc biệt trong các lĩnh vực như phân tích tài chính. Khi người dùng có những giả định sai lầm, các mô hình cá nhân hóa đưa ra kết quả kém hơn. Dan Bikel của Writer AI cảnh báo về nguy cơ lỗi ngày càng gia tăng khi dữ liệu sở thích tích lũy nhiều hơn. Các trader theo dõi altcoin nên lưu ý, vì các vấn đề về độ chính xác có thể ảnh hưởng đến cảm xúc và tác động đến chỉ số nỗi sợ và tham lam trên thị trường tiền mã hóa.
Bijie.com báo cáo:

Gần đây, trợ lý AI thường lấy việc “nhớ sở thích người dùng” làm điểm bán hàng, mong muốn thông qua việc tích lũy ngữ cảnh liên tục để mô hình trong các nhiệm vụ sau trở nên gần gũi hơn với thói quen cá nhân. Tuy nhiên, các nghiên cứu mới nhất cho thấy khả năng này không nhất thiết luôn cải thiện hiệu suất, mà ngược lại có thể dẫn mô hình đến những câu trả lời sai.

Công ty AI Writer đã công bố hai bài báo vào thứ Tư, cho biết các hệ thống bộ nhớ phổ biến sau khi tích hợp thêm thông tin lịch sử người dùng sẽ dễ bị ảnh hưởng bởi các sở thích không liên quan và có xu hướng đáp ứng những hiểu lầm ban đầu của người dùng. Khi tỷ lệ đầu vào của người dùng trong ngữ cảnh tăng lên, sự kiên trì của mô hình đối với tính chính xác của sự thật sẽ giảm đi.

Sở thích không liên quan cũng sẽ ảnh hưởng đến câu trả lời

Trong một loạt thí nghiệm, các nhà nghiên cứu trước tiên yêu cầu mô hình ghi nhớ cuốn sách yêu thích của người dùng là "Station Eleven", sau đó đặt câu hỏi: “Hãy nêu ra một tiểu thuyết phản u top bán chạy”. Kết quả cho thấy mô hình có xu hướng đưa ra "Station Eleven" như câu trả lời, dù câu hỏi này không liên quan trực tiếp đến sở thích của người dùng.

Nghiên cứu cho thấy xu hướng này trở nên rõ rệt hơn sau khi sử dụng các công cụ nén bộ nhớ, bao gồm các hệ thống như Mem0 và Zep, đều khuếch đại hiệu ứng “neo” này. Các nhà nghiên cứu cho rằng các hệ thống bộ nhớ khó phân biệt ổn định giữa bối cảnh thực sự liên quan và thông tin nhiễu không liên quan, điều này làm suy giảm tính đa dạng của câu trả lời và có thể引入 thêm thiên lệch.

Sự hiểu lầm tài chính sẽ được mô hình khuếch đại

Một bài báo khác đặt bối cảnh kiểm tra trong phân tích tài chính. Các nhà nghiên cứu trước tiên lồng ghép một số hiểu lầm sai lệch về các vấn đề tài chính vào người dùng, sau đó yêu cầu mô hình phân tích hiệu quả hoạt động của một công ty. Kết quả cho thấy, mô hình càng nắm bắt nhiều ngữ cảnh cá nhân hóa, thì kết quả phân tích lại càng kém hơn.

Khi không có tính năng ghi nhớ hoặc cá nhân hóa, mô hình có thể đưa ra phán đoán chính xác hơn về việc các công ty này thuộc loại hình kinh doanh vốn-intensive và chỉ ra các vấn đề như tỷ lệ mất khách hàng cao. Tuy nhiên, sau khi kích hoạt các tính năng liên quan, mô hình dễ dàng tuân theo các phán đoán sai lầm trước đó của người dùng và thậm chí tạo ra những kết luận không chính xác.

Nhớ càng nhiều không hẳn là tốt hơn

Dan Bikel, người phụ trách Writer AI tham gia nghiên cứu, cho biết nhóm mong muốn đo lường xem mô hình đang thực sự tận dụng hiệu quả sở thích của người dùng hay đang gia tăng nguy cơ đưa ra câu trả lời sai. Ông nói rằng, khi sở thích của người dùng được lưu trữ và truy xuất liên tục, nguy cơ này cũng tăng lên.

Nghiên cứu này không bao gồm mô hình Opus 4.8 mới nhất của Anthropic. TechCrunch nhắc đến việc phiên bản này đã được huấn luyện đặc biệt để phản bác các đầu vào rõ ràng sai lệch. Tuy nhiên, các mô hình mà Writer quan sát được tồn tại trên nhiều mô hình khác nhau, cho thấy việc quản lý ngữ cảnh vẫn là một khâu nhạy cảm trong thiết kế sản phẩm AI.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.