Tongyi Lab Meluncurkan VimRAG: Kerangka Kerja RAG Multimodal dengan Memory Graph

iconKuCoinFlash
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Tongyi Lab merilis kerangka kerja multimodal RAG baru, VimRAG, pada 10 April (UTC+8), berbasis MetaEra. Kerangka kerja ini mengatasi masalah 'titik buta status' dengan mengubah riwayat linier menjadi graf memori. Ia menggunakan struktur DAG dinamis untuk melacak jalur penalaran dan mengurangi pengambilan data yang berulang. Berita on-chain menyoroti integrasi GGPO untuk penugasan kredit dan alokasi token. Versi Qwen3-VL-8B-Instruct memimpin dalam benchmark seperti SlideVQA dan MMLongBench. Pembaruan ini mendukung tugas kompleks, panjang, dan multimodal. Pencatatan token baru dapat mendapat manfaat dari pendekatan penalaran terstruktur ini.

Berita ME, pada 10 April (UTC+8), Laboratorium Tongyi Alibaba secara resmi meluncurkan kerangka RAG multimodal generasi baru, VimRAG, yang secara khusus menangani masalah "blind spot status" yang telah lama ada pada sistem saat ini. VimRAG meningkatkan catatan historis linier menjadi peta memori multimodal (Multimodal Memory Graph), mengorganisasi proses inferensi dengan struktur directed acyclic graph (DAG), secara efektif menghilangkan pencarian berulang, serta melacak seluruh jalur eksplorasi. Memperkenalkan Graph-Modulated Visual Memory Encoding, yang memungkinkan alokasi token adaptif untuk data visual berbeban tinggi seperti gambar, dilengkapi mekanisme GGPO untuk alokasi kredit halus, meningkatkan akurasi atribusi inferensi. Menurut data evaluasi yang dirilis, VimRAG menunjukkan kinerja unggul dalam berbagai uji coba multimodal seperti SlideVQA, MMLongBench, dan LVBench, dengan versi Qwen3-VL-8B-Instruct mencapai skor komprehensif teratas dibanding solusi sejenis. Tujuan VimRAG adalah mendorong RAG multimodal dari "pencarian sederhana" menuju "inferensi terstruktur dan andal", menyediakan solusi sistemik yang lebih kuat untuk menangani dokumen panjang kompleks dan skenario campuran multimodal. (Sumber: BlockBeats)

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.