Фреймворк MeMo от MIT повышает производительность LLM на 26%

Обучение большой языковой модели чему-то новому после её обучения, мягко говоря, — большая проблема. Вам либо нужно переобучать всю модель (дорого), либо вставлять документы в контекстное окно (ограничено), либо добавлять системы поиска, которые часто сбиваются при сложных запросах. Исследователи из MIT CSAIL, Национального университета Сингапура и A*STAR недавно опубликовали фреймворк, который обходит все три проблемы.

Фреймворк называется MeMo — сокращение от Memory as a Model. Он был подробно описан в статье, опубликованной 20 мая 2026 года (arXiv:2605.15156), и его основная идея изящно проста: вместо того чтобы встраивать новые знания в существующую LLM, обучается отдельная, более мелкая модель, задача которой — только запоминать информацию. Основная LLM остается замороженной и задает вопросы модели памяти, когда ей нужны ответы.

Как на самом деле работает MeMo

В техническом плане MeMo использует пятиэтапную рефлексивную QA-синтезирующую конвейерную систему для обучения модели памяти новым знаниям в конкретной области. Во время вывода замороженная исполнительная LLM, такая как Qwen2.5 или Gemini-3-Flash, запрашивает модель памяти через структурированный многоэтапный протокол. Модель памяти внутренне усваивает информацию, а не просто извлекает фрагменты текста, что отличает её от традиционных систем, основанных на извлечении и дополнении генерации (RAG).

Эта архитектура избегает катастрофического забывания — явления, при котором обновление нейронной сети на новых данных приводит к потере ранее освоенных способностей. Это также означает, что вам никогда не придется заново настраивать крупную и дорогую исполнительную модель при появлении новой информации. Вы просто обновляете меньшую модель памяти.

Тестирование на наборах данных, включающих BrowseComp-Plus, NarrativeQA и MuSiQue, показало повышение производительности до 26,73% при переходе исследователей с моделей Executive на Gemini-3-Flash, причем без переобучения компонента Memory. Модель Memory, после обучения, работала с различными Executive LLM как универсальный адаптер.

Эта совместимость «подключи и работай» распространяется как на открытые, так и на закрытые LLM. Вы можете обучить модель Memory один раз и развернуть её с любой передовой моделью, которую предпочитает ваша организация, или заменять исполнительные модели по мере появления более качественных. Слой знаний сохраняется независимо.

RAG, в сравнении, имеет хорошо задокументированные недостатки. Он чувствителен к шуму в извлеченных документах, испытывает трудности с рассуждениями на основе нескольких документов и теряет точность, когда вопросы требуют синтеза информации из множества источников. Подход MeMo, заключающийся в кодировании знаний в веса модели, а не в извлечении сырого текста, кажется, более надежно справляется с такими сценариями.

Почему это важно для крипто-ИИ-инфраструктуры

В исследовании MeMo не упоминаются токены блокчейна или крипто-специфические проекты. Давайте сразу это проясним.

Анализ в цепочке — один из самых очевидных вариантов использования. ИИ-агенты, которые отслеживают протоколы DeFi, мониторят активность кошельков или выявляют подозрительные транзакции, нуждаются в постоянно обновляемых данных о новых контрактах, предложениях по управлению и рыночных условиях. Архитектура типа MeMo может позволить агенту анализа DeFi поддерживать постоянное, обновляемое хранилище знаний в своей модели памяти, одновременно выполняя вывод с использованием любой передовой LLM, предлагающей наилучшие возможности рассуждений. Когда протокол изменяет свои параметры, вы обновляете модель памяти. Исполнитель остается неизменным.

Угол операционных затрат имеет большое значение. Переобучение крупных моделей — один из самых больших расходов для криптовалютных приложений, созданных на основе ИИ, и это повторяющаяся стоимость, которая растет в зависимости от частоты изменений исходных данных. Рамка, которая исключает необходимость переобучения при сохранении или улучшении производительности, может значительно снизить стоимость эксплуатации сложных ИИ-агентов.

Что должны отслеживать инвесторы

RAG стал стандартным подходом для поддержания актуальности LLM, и вокруг него была создана целая экосистема векторных баз данных, моделей встраивания и конвейеров извлечения. Если подход MeMo окажется более эффективным в масштабе, часть этой инфраструктуры станет менее необходимой.

Одним из рисков, заслуживающим внимания, является то, что тесты MeMo проводились на академических наборах данных. Реальная производительность в шумных и враждебных средах, таких как криптовалютные рынки, может отличаться.