Tongyi Lab запускає VimRAG: багатомодальну RAG-систему з графом пам’яті

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Tongyi Lab випустила нову багатомодальну RAG-систему VimRAG 10 квітня (UTC+8) на основі MetaEra. Ця система вирішує проблему «сліпих зон стану», перетворюючи лінійну історію на граф пам’яті. Вона використовує динамічну структуру DAG для відстеження шляхів міркувань та зменшення надлишкового витягування даних. У блокчейн-новинах підкреслюється інтеграція GGPO для розподілу кредитів та токенів. Версія Qwen3-VL-8B-Instruct показує найкращі результати на тестах, таких як SlideVQA та MMLongBench. Оновлення підтримує складні, довгі та багатомодальні завдання. Нові токени можуть отримати переваги від цього структурованого підходу до міркувань.

Новини ME: 10 квітня (UTC+8) лабораторія Tongyi Alibaba випустила нове багатомодальне RAG-рішення VimRAG, спрямоване на вирішення довготривалої проблеми «сліпих зон стану» у існуючих системах. VimRAG замінює традиційний лінійний історичний запис на багатомодальну пам’ять-граф (Multimodal Memory Graph), організовуючи процес міркувань за допомогою динамічної орієнтованої ациклічної структури (DAG), що ефективно виключає надлишковий пошук і забезпечує повний відстежування шляхів дослідження. Впроваджено графово-модульоване кодування візуальної пам’яті (Graph-Modulated Visual Memory Encoding), що дозволяє адаптивно розподіляти токени для візуальних даних, таких як зображення, разом із механізмом GGPO для точного розподілу кредитів на дрібному рівні, підвищуючи точність відстеження причинно-наслідкових зв’язків. Згідно з опублікованими тестовими даними, VimRAG виявився високопродуктивним у багатомодальних тестах, таких як SlideVQA, MMLongBench і LVBench, а версія Qwen3-VL-8B-Instruct показала найвищий загальний бал серед аналогічних рішень. Мета VimRAG — перевести багатомодальне RAG від «простого пошуку» до «структурованого та надійного міркування», надаючи потужніші системні рішення для обробки складних довгих документів та багатомодальних сценаріїв. (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.