MITのMeMoフレームワークがLLMのパフォーマンスを26%向上

トレーニング済みの大規模言語モデルに新しい知識を教えることは、優しく言えば面倒である。全体を再トレーニングする（高コスト）、ドキュメントをコンテキストウィンドウに詰め込む（制限あり）、または複雑なクエリでしばしば失敗する検索システムを追加するしかない。MIT CSAIL、シンガポール国立大学、A*STARの研究者たちは、この3つの問題を回避する新しいフレームワークを発表した。

このフレームワークは「MeMo」（Memory as a Modelの略）と呼ばれ、2026年5月20日に公開された論文（arXiv:2605.15156）で詳細に説明されています。その核心的なアイデアは非常に洗練されてシンプルです：既存のLLMに新しい知識を無理に組み込むのではなく、物事を記憶することだけを目的とした別途の小型モデルを訓練します。主要なLLMは凍結したままであり、答えが必要なときにメモリモデルに質問するだけです。

MeMoが実際にどのように機能するか

技術的に言えば、MeMoは、新しいドメイン知識に対してMemoryモデルを訓練するために、5段階のリフレクションQA合成パイプラインを使用しています。推論時には、凍結されたExecutive LLM（例：Qwen2.5やGemini-3-Flash）が、構造化されたマルチターンプロトコルを通じてMemoryモデルにクエリを送信します。Memoryモデルは、テキストの断片を単に検索するのではなく、情報を内部に取り込みます。これが、従来の検索拡張生成（RAG）システムとの違いです。

このアーキテクチャは、新しいデータでニューラルネットワークを更新することで以前に学習した能力を失う「カタストロフィックな忘却」を回避します。また、新しい情報が到着しても、大規模で高コストなエグゼクティブモデルを再調整する必要がなく、小さなメモリーモデルを更新するだけで済みます。

BrowseComp-Plus、NarrativeQA、MuSiQueを含むデータセットでのベンチマークでは、研究者がExecutiveモデルをGemini-3-Flashに切り替えたところ、Memoryコンポーネントを再トレーニングせずに最大26.73%の性能向上が確認されました。Memoryモデルは、一度トレーニングされれば、Executive LLMの異なるモデル間でユニバーサルアダプターのように機能しました。

このプラグアンドプレイ互換性は、オープンソースおよびクローズドソースのLLMの両方に適用されます。Memoryモデルを一度訓練すれば、組織が好むフロンティアモデルにデプロイしたり、より優れたExecutiveモデルが利用可能になった際に交換したりできます。知識層は独立して保持されます。

比較すると、RAGは明確に弱点が報告されています。取得されたドキュメントのノイズに敏感であり、複数のドキュメントを用いた推論が苦手で、多くのソースから情報を統合する必要がある質問に対して性能が低下します。MeMoは、生のテキストを検索するのではなく、知識をモデルの重みにエンコードするアプローチを採用しており、これらのシナリオに対してより堅牢に対応できるように見えます。

これが暗号通貨AIインフラにとって重要な理由

MeMoの調査では、ブロックチェーントークンや暗号資産関連プロジェクトは一切言及されていません。まずこの点を明確にしておきます。

オンチェーン分析は最も明確な使用例の一つです。DeFiプロトコルを監視し、ウォレットの活動を追跡し、疑わしい取引を警告するAIエージェントは、新しいコントラクト、ガバナンス提案、および市場状況について常に最新の知識を必要とします。MeMoスタイルのアーキテクチャを使用すれば、DeFi分析エージェントは、最適な推論能力を提供する最先端のLLMを通じて推論を実行しながら、メモリモデルに永続的で更新可能な知識ストアを維持できます。プロトコルのパラメータが変更された場合、メモリモデルを更新します。エグゼクティブは変更されません。

運用コストの観点は重要です。AIネイティブな暗号アプリケーションにとって、大規模モデルの再学習は最大の費用の一つであり、基盤となるデータの変更頻度に比例して継続的に発生します。再学習を排除しつつパフォーマンスを維持または向上させるフレームワークは、高度なAIエージェントの運用コストを大幅に削減できます。

投資家が注目すべき点

RAGはLLMを最新の状態に保つためのデフォルトのアプローチであり、ベクターデータベース、埋め込みモデル、検索パイプラインのエコシステムがこれに基づいて構築されてきました。MeMoのアプローチがスケールにおいてより効果的であることが証明されれば、そのようなインフラの一部はそれほど必要ではなくなるかもしれません。

注目すべきリスク：MeMoのベンチマークは学術用データセットで実施されました。暗号市場のようなノイズが多く、敵対的な実環境でのパフォーマンスは異なる可能性があります。