麻省理工學院的 MeMo 框架將大語言模型效能提升 26%

iconCryptoBriefing
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
麻省理工學院的研究人員與新加坡及 A*STAR 的團隊共同推出了 MeMo 框架,該框架無需重新訓練即可提升 LLM 性能 26.73%。該系統使用較小的模型來存儲和檢索知識,同時保持主 LLM 冻結。此鏈上新聞更新強調了在 BrowseComp-Plus 和 NarrativeQA 等數據集上的表現提升,並兼容開源和閉源模型。該方法避免了災難性遺忘,有望惠及區塊鏈和 DeFi 等加密新聞領域,這些領域的 AI 代理需要在無需重新訓練的情況下獲取最新知識。

在訓練完成後,想讓大型語言模型學習新知識,說得客氣點,是件麻煩事。你要麼重新訓練整個模型(成本高昂),要麼把文件塞進它的上下文窗口中(容量有限),要麼附加檢索系統,但這些系統經常在處理複雜查詢時失效。來自麻省理工學院 CSAIL、新加坡國立大學和 A*STAR 的研究人員剛剛發表了一個框架,避開了這三個問題。

這個框架稱為 MeMo,是 Memory as a Model 的縮寫。它於 2026 年 5 月 20 日發布的論文中詳細闡述(arXiv:2605.15156),其核心理念簡潔優雅:不是將新知識強行注入現有的 LLM,而是訓練一個獨立且較小的模型,其唯一任務就是記憶資訊。主 LLM 保持凍結,僅在需要答案時向記憶模型提問。

MeMo 如何實際運作

從技術層面來看,MeMo 使用五步反思式 QA 合成管道來訓練 Memory 模型以學習新領域知識。在推理時,凍結的 Executive LLM(例如 Qwen2.5 或 Gemini-3-Flash)透過結構化的多輪協議查詢 Memory 模型。Memory 模型會內化資訊,而非僅僅檢索文字片段,這正是其與傳統檢索增強生成(RAG)架構的區別所在。

此架構避免了災難性遺忘現象,即在新數據上更新神經網絡會導致其失去先前學到的能力。同時,當新資訊到來時,您無需重新調校龐大且昂貴的執行模型,只需更新較小的記憶模型即可。

廣告

在包含 BrowseComp-Plus、NarrativeQA 和 MuSiQue 的數據集上進行的基準測試顯示,研究人員在未重新訓練記憶組件的情況下,將執行模型切換為 Gemini-3-Flash 後,性能提升了高達 26.73%。記憶模型一旦訓練完成,即可像通用適配器一樣適用於不同的執行 LLM。

這種即插即用的相容性適用於開源和閉源的 LLM。您只需訓練一次 Memory 模型,即可與您組織偏好的任何前沿模型部署,或在更優秀的 Executive 模型出現時進行替換。知識層獨立保持不變。

相比之下,RAG 具有明確的弱點。它對檢索文件中的噪聲敏感,難以進行多文件推理,且當問題需要整合多個來源的信息時,性能會下降。MeMo 將知識編碼至模型權重而非檢索原始文本的方法,在處理這些情境時似乎更為穩健。

這對加密貨幣 AI 基礎設施為何重要

MeMo 研究中未提及任何區塊鏈代幣或加密貨幣專案,我們先明確這一點。

鏈上分析是最明顯的應用場景之一。監控 DeFi 協議、追蹤錢包活動或標記可疑交易的 AI 代理,需要持續更新關於新合約、治理提案和市場狀況的知識。一種類似 MeMo 的架構,可讓 DeFi 分析代理在運行推理時,透過任何提供最佳推理能力的前沿 LLM,同時在其記憶模型中維持一個持久且可更新的知識庫。當協議更改其參數時,您只需更新記憶模型,執行器則保持不變。

運營成本的角度至關重要。重新訓練大型模型是原生加密貨幣 AI 應用的最大開支之一,這是一項重複性成本,其規模取決於底層數據變化的頻率。一個能在不重新訓練的情況下維持或提升性能的框架,可顯著降低運行複雜 AI 代理的成本。

投資者應關注的重點

RAG 一直是保持 LLM 最新狀態的默認方法,並圍繞它建立了完整的生態系統,包括向量資料庫、嵌入模型和檢索管道。如果 MeMo 的方法在規模上證明更有效,部分此類基礎設施將變得不那麼重要。

一個值得注意的風險:MeMo 的基準測試是在學術數據集上進行的。在加密貨幣市場等嘈雜且具有對抗性的真實環境中,其表現可能有所不同。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露