Noticias de ME: el 10 de abril (UTC+8), el Laboratorio Tongyi de Alibaba lanzó oficialmente el nuevo marco multimodal RAG, VimRAG, diseñado para abordar de manera decisiva el problema persistente de "zonas ciegas de estado" en los sistemas actuales. VimRAG reemplaza el historial lineal tradicional por un grafo de memoria multimodal (Multimodal Memory Graph), organizando el proceso de razonamiento mediante una estructura de grafo dirigido acíclico (DAG) para eliminar eficazmente la recuperación redundante y rastrear en tiempo real todas las rutas de exploración. Se introduce la codificación de memoria visual modulada por grafo (Graph-Modulated Visual Memory Encoding), que permite una asignación adaptativa de tokens para datos visuales de alta carga, como imágenes, junto con el mecanismo GGPO para una asignación de crédito de granularidad fina y una mayor precisión en la atribución del razonamiento. Según los datos de evaluación publicados, VimRAG destacó en múltiples pruebas de referencia multimodales, incluidas SlideVQA, MMLongBench y LVBench, con la versión Qwen3-VL-8B-Instruct logrando la puntuación general más alta entre soluciones similares. El objetivo de VimRAG es elevar el RAG multimodal desde una "simple recuperación" hacia un "razonamiento estructurado y confiable", ofreciendo una solución sistémica más robusta para manejar documentos largos complejos y escenarios híbridos multimodales. (Fuente: BlockBeats)
Tongyi Lab lanza VimRAG: Marco multimodal RAG con grafo de memoria
KuCoinFlashCompartir






Tongyi Lab lanzó un nuevo marco multimodal RAG, VimRAG, el 10 de abril (UTC+8), basado en MetaEra. El marco aborda el problema del "punto ciego de estado" convirtiendo el historial lineal en un grafo de memoria. Utiliza una estructura dinámica DAG para rastrear rutas de razonamiento y reducir la recuperación redundante. Las noticias en cadena destacan la integración de GGPO para la asignación de crédito y la distribución de tokens. La versión Qwen3-VL-8B-Instruct lidera en benchmarks como SlideVQA y MMLongBench. La actualización admite tareas complejas, de largo formato y multimodales. Las nuevas listas de tokens podrían beneficiarse de este enfoque de razonamiento estructurado.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.