Tongyi Lab ra mắt VimRAG: Khung RAG đa phương tiện với đồ thị bộ nhớ

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Tongyi Lab đã phát hành khung RAG đa phương tiện mới, VimRAG, vào ngày 10 tháng 4 (UTC+8), dựa trên MetaEra. Khung này giải quyết vấn đề "điểm mù trạng thái" bằng cách chuyển đổi lịch sử tuyến tính thành đồ thị bộ nhớ. Nó sử dụng cấu trúc DAG động để theo dõi các đường dẫn suy luận và giảm việc truy xuất trùng lặp. Tin tức trên chuỗi nhấn mạnh sự tích hợp GGPO để phân bổ tín dụng và phân phối token. Phiên bản Qwen3-VL-8B-Instruct dẫn đầu trong các bài kiểm tra như SlideVQA và MMLongBench. Bản cập nhật hỗ trợ các tác vụ phức tạp, dài hạn và đa phương tiện. Các token mới có thể hưởng lợi từ cách tiếp cận suy luận có cấu trúc này.

Tin tức từ ME News, ngày 10 tháng 4 (UTC+8), Phòng thí nghiệm Tongyi của Alibaba chính thức ra mắt khung RAG đa mô态 thế hệ mới VimRAG, tập trung giải quyết vấn đề “vùng mù trạng thái” lâu năm trong các hệ thống hiện tại. VimRAG nâng cấp lịch sử tuyến tính truyền thống thành đồ thị ký ức đa mô态 (Multimodal Memory Graph), tổ chức quá trình suy luận theo cấu trúc đồ thị có hướng không chu trình (DAG), loại bỏ hiệu quả việc truy vấn trùng lặp và theo dõi toàn bộ hành trình khám phá. Giới thiệu mã hóa ký ức hình ảnh được điều chỉnh bởi đồ thị (Graph-Modulated Visual Memory Encoding), thực hiện phân bổ Token thích ứng cho dữ liệu hình ảnh và các loại dữ liệu hình ảnh tải cao, kết hợp cơ chế GGPO để đạt được phân bổ tín nhiệm tinh vi, nâng cao độ chính xác trong suy luận và truy nguyên nguyên nhân. Theo dữ liệu đánh giá được công bố, VimRAG thể hiện nổi bật trong nhiều bài kiểm tra chuẩn đa mô态 như SlideVQA, MMLongBench, LVBench, phiên bản Qwen3-VL-8B-Instruct đạt điểm tổng hợp dẫn đầu so với các giải pháp cùng loại. Mục tiêu của VimRAG là đưa RAG đa mô態 từ “truy vấn đơn giản” tiến lên “suy luận đáng tin cậy có cấu trúc”, cung cấp giải pháp hệ thống mạnh mẽ hơn cho các tình huống xử lý tài liệu dài phức tạp và cảnh hỗn hợp đa mô態. (Nguồn: BlockBeats)

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.