LangChain thêm tính năng Auto-QC cho các tác nhân AI để đảm bảo hoàn thành nhiệm vụ

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Các nền tảng tin tức AI và tiền mã hóa đang báo cáo rằng LangChain, hợp tác cùng MetaEra, đã ra mắt RubricMiddleware cho dòng sản phẩm Deep Agents của mình. Công cụ này cho phép các tác nhân AI tự động kiểm tra đầu ra dựa trên các tiêu chí đã định trước, như kiểm tra mã hoặc độ hoàn chỉnh của báo cáo. Nếu đầu ra không đạt yêu cầu, nhiệm vụ sẽ được điều chỉnh lại cho đến khi vượt qua hoặc đạt giới hạn số lần lặp lại. Hệ thống nhắm đến các nhiệm vụ dài hạn nơi định dạng và chất lượng nội dung là yếu tố then chốt. Các danh sách token mới và những tiến bộ AI như thế này đang thu hút sự chú ý từ cả nhà phát triển lẫn nhà giao dịch. LangChain cho biết công cụ này phù hợp nhất với các nhiệm vụ có tiêu chuẩn rõ ràng, chẳng hạn như kiểm tra mã hoặc kiểm tra trích dẫn, giúp AI trở nên đáng tin cậy hơn ngoài việc chỉ trò chuyện.
ME AI tin tức, theo giám sát của Beating, LangChain đã ra mắt thành phần mới Deep Agents mang tên RubricMiddleware, giúp AI Agent kiểm tra và chỉnh sửa đầu ra của chính mình theo các tiêu chuẩn đã định trước. Người phát triển có thể xác định rõ ràng các “tiêu chí hoàn thành” cho nhiệm vụ, ví dụ: mã phải vượt qua bài kiểm tra, báo cáo phải bao phủ các chương mục được chỉ định, câu trả lời không được chứa nội dung bị cấm. Mỗi khi Agent chuẩn bị giao kết quả, hệ thống sẽ gọi một mô hình đánh giá để kiểm tra từng mục; nếu chưa đạt yêu cầu, phản hồi sẽ được trả về cho Agent ban đầu để tiếp tục chỉnh sửa, cho đến khi vượt qua kiểm tra hoặc đạt giới hạn số lần lặp lại. Cơ chế này giải quyết vấn đề phổ biến khi Agent thực hiện nhiệm vụ dài: “thiếu bước cuối cùng”. Nhiều Agent không phải không làm được, mà thường bỏ sót các yêu cầu cứng như định dạng, kiểm tra, trích dẫn, chương mục. RubricMiddleware giống như một nhân viên kiểm tra chất lượng tự động được thêm vào chuỗi nhiệm vụ, giúp Agent hiểu rõ thế nào là hoàn thành thực sự, chứ không chỉ tạo ra một câu trả lời trông có vẻ tương tự. Tài liệu của LangChain cũng nêu rõ, phương pháp này phù hợp nhất với các nhiệm vụ có tiêu chí chấp nhận rõ ràng, ví dụ: số âm tiết của bài thơ haiku có đúng không, bài kiểm tra có vượt qua sau khi tái cấu trúc mã hay không, báo cáo có bao gồm đầy đủ các phần bắt buộc hay không. Đối với người dùng thông thường, giá trị của nó không nằm ở việc giúp Agent nói chuyện hay hơn, mà ở chỗ khiến Agent trở nên giống một người thực thi có thể giao việc theo danh sách kiểm tra. (Nguồn: MLion)
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.