麻省理工學院的 MeMo 框架將大語言模型效能提升 26%

在訓練完成後，想讓大型語言模型學習新知識，說得客氣點，是件麻煩事。你要麼重新訓練整個模型（成本高昂），要麼把文件塞進它的上下文窗口中（容量有限），要麼附加檢索系統，但這些系統經常在處理複雜查詢時失效。來自麻省理工學院 CSAIL、新加坡國立大學和 A*STAR 的研究人員剛剛發表了一個框架，避開了這三個問題。

這個框架稱為 MeMo，是 Memory as a Model 的縮寫。它於 2026 年 5 月 20 日發布的論文中詳細闡述（arXiv:2605.15156），其核心理念簡潔優雅：不是將新知識強行注入現有的 LLM，而是訓練一個獨立且較小的模型，其唯一任務就是記憶資訊。主 LLM 保持凍結，僅在需要答案時向記憶模型提問。

MeMo 如何實際運作

從技術層面來看，MeMo 使用五步反思式 QA 合成管道來訓練 Memory 模型以學習新領域知識。在推理時，凍結的 Executive LLM（例如 Qwen2.5 或 Gemini-3-Flash）透過結構化的多輪協議查詢 Memory 模型。Memory 模型會內化資訊，而非僅僅檢索文字片段，這正是其與傳統檢索增強生成（RAG）架構的區別所在。

此架構避免了災難性遺忘現象，即在新數據上更新神經網絡會導致其失去先前學到的能力。同時，當新資訊到來時，您無需重新調校龐大且昂貴的執行模型，只需更新較小的記憶模型即可。

在包含 BrowseComp-Plus、NarrativeQA 和 MuSiQue 的數據集上進行的基準測試顯示，研究人員在未重新訓練記憶組件的情況下，將執行模型切換為 Gemini-3-Flash 後，性能提升了高達 26.73%。記憶模型一旦訓練完成，即可像通用適配器一樣適用於不同的執行 LLM。

這種即插即用的相容性適用於開源和閉源的 LLM。您只需訓練一次 Memory 模型，即可與您組織偏好的任何前沿模型部署，或在更優秀的 Executive 模型出現時進行替換。知識層獨立保持不變。

相比之下，RAG 具有明確的弱點。它對檢索文件中的噪聲敏感，難以進行多文件推理，且當問題需要整合多個來源的信息時，性能會下降。MeMo 將知識編碼至模型權重而非檢索原始文本的方法，在處理這些情境時似乎更為穩健。

這對加密貨幣 AI 基礎設施為何重要

MeMo 研究中未提及任何區塊鏈代幣或加密貨幣專案，我們先明確這一點。

鏈上分析是最明顯的應用場景之一。監控 DeFi 協議、追蹤錢包活動或標記可疑交易的 AI 代理，需要持續更新關於新合約、治理提案和市場狀況的知識。一種類似 MeMo 的架構，可讓 DeFi 分析代理在運行推理時，透過任何提供最佳推理能力的前沿 LLM，同時在其記憶模型中維持一個持久且可更新的知識庫。當協議更改其參數時，您只需更新記憶模型，執行器則保持不變。

運營成本的角度至關重要。重新訓練大型模型是原生加密貨幣 AI 應用的最大開支之一，這是一項重複性成本，其規模取決於底層數據變化的頻率。一個能在不重新訓練的情況下維持或提升性能的框架，可顯著降低運行複雜 AI 代理的成本。

投資者應關注的重點

RAG 一直是保持 LLM 最新狀態的默認方法，並圍繞它建立了完整的生態系統，包括向量資料庫、嵌入模型和檢索管道。如果 MeMo 的方法在規模上證明更有效，部分此類基礎設施將變得不那麼重要。

一個值得注意的風險：MeMo 的基準測試是在學術數據集上進行的。在加密貨幣市場等嘈雜且具有對抗性的真實環境中，其表現可能有所不同。