Ang MeMo Framework ng MIT ay nagpapataas ng performance ng LLM ng 26%

Ang pagtuturo ng bagong kaalaman sa isang malaking language model pagkatapos ng pag-train ay, kung pipiliin nating maging mapagpahalaga, isang pagod. O ikaw ay magre-retrain ng buong sistema (mahal), isisigaw ang mga dokumento sa kanyang context window (limitado), o i-attach ang mga retrieval system na madalas ay nahihirapan sa mga kumplikadong tanong. Ang mga mananaliksik mula sa MIT CSAIL, ang National University of Singapore, at A*STAR ay naglabas ng isang framework na iiwas sa lahat ng tatlong problema.

Ang framework ay tinatawag na MeMo, maikling bersyon ng Memory as a Model. Ito ay detalyado sa isang papel na inilabas noong Mayo 20, 2026 (arXiv:2605.15156), at ang pangunahing ideya ay simpleng elegante: sa halip na pilitin ang bagong kaalaman sa isang umiiral na LLM, ituro ang isang hiwalay, mas maliit na modelo na ang tanging gawain ay tandaan ang mga bagay. Ang pangunahing LLM ay nananatiling frozen. Ito ay nagtatanong lang sa memory model kapag kailangan ng mga sagot.

Paano gumagana ang MeMo

Sa teknikal na terminolohiya, gumagamit ang MeMo ng isang lima-hakbang na reflection QA synthesis pipeline upang matuto ang Memory model sa bagong kaalaman sa isang partikular na larangan. Sa panahon ng inference, ang frozen Executive LLM, tulad ng Qwen2.5 o Gemini-3-Flash, ay nagtatanong sa Memory model sa pamamagitan ng isang structured multi-turn protocol. Ang Memory model ay nagsasalo ng impormasyon kaysa mag-imbak lamang ng mga teksto, na siyang nagpapakita ng pagkakaiba nito sa mga tradisyonal na retrieval-augmented generation (RAG) na sistema.

Ipinaglalaban ng arkitekturang ito ang catastrophic forgetting, ang fenomeno kung saan ang pag-update ng isang neural network sa bagong data ay nagdudulot ng pagkawala ng mga dating natututunan na kakayahan. Ibig sabihin nito ay hindi ka na kailangang muli ayusin ang malaki at mahal na Executive model kapag dumating ang bagong impormasyon. Kailangan mo lang i-update ang mas maliit na Memory model.

Paghahayag

Ang mga benchmark na ginawa sa mga dataset kabilang ang BrowseComp-Plus, NarrativeQA, at MuSiQue ay nagpakita ng pagpapabuti sa performance hanggang 26.73% nang palitan ng mga mananaliksik ang Executive models sa Gemini-3-Flash, lahat nang hindi nagre-retrain sa Memory component. Ang Memory model, matapos ma-train, ay gumagana sa iba’t ibang Executive LLMs tulad ng isang universal adapter.

Ang plug-and-play compatibility na ito ay umiiral sa parehong open-source at closed-source LLMs. Maaari mong i-train ang Memory model nang isang beses at i-deploy ito kasama ang anumang frontier model na pinipili ng iyong organisasyon, o palitan ang Executive models kapag mas mabuting mga bersyon ay magagamit. Ang knowledge layer ay patuloy na nakakabit nang independiyente.

Ang RAG, sa kumpara, ay may maayos na dokumentadong mga kahinaan. Ito ay sensitibo sa ingay sa mga nakuha na dokumento, nagkakaroon ng problema sa pag-iisip sa maraming dokumento, at bumabagsak kapag nangangailangan ang mga tanong ng pagpagsasama ng impormasyon mula sa maraming pinagkukunan. Ang pagkakaroon ng MeMo na pagsasaliksik ng kaalaman sa mga timbang ng modelo kaysa sa pagkuha ng orihinal na teksto ay tila mas matatag sa mga sitwasyong ito.

Bakit mahalaga ito para sa crypto AI infrastructure

Walang blockchain tokens o crypto-specific na proyekto ang nabanggit sa pananaliksik ng MeMo. Malinaw na malinaw iyon sa simula.

Ang on-chain analysis ay isa sa mga pinakamalinaw na paggamit. Ang mga AI agent na nagmomonito sa DeFi protocols, tinataya ang aktibidad ng wallet, o nagpapalabas ng mga sospeksong transaksyon ay nangangailangan ng patuloy na updated na kaalaman tungkol sa mga bagong contract, governance proposals, at mga kondisyon ng merkado. Maaaring gamitin ng isang MeMo-style na arkitektura ang isang DeFi analysis agent upang panatilihin ang isang patuloy, i-update na imbakan ng kaalaman sa kanyang Memory model habang nagpapatakbo ng inference sa anumang frontier LLM na nag-aalok ng pinakamahusay na kakayahan sa pag-iisip. Kapag nagbabago ang isang protocol ang kanyang mga parameter, i-update mo ang Memory model. Ang Executive ay nananatiling hindi binabago.

Mahalaga ang aspeto ng operational cost. Ang pag-retrain ng malalaking model ay isa sa mga pinakamalaking gastos para sa AI-native na crypto applications, at ito ay isang paulit-ulit na gastos na tumataas batay sa kung gaano kadalas nagbabago ang underlying data. Isang framework na nagtatanggal ng pag-retrain habang pinapanatili o pinabababa ang performance ay maaaring makabawas nang may kahulugan sa gastos ng pagpapatakbo ng mga kumplikadong AI agents.

Ano ang dapat panatagin ng mga investor

Ang RAG ay ang default na paraan para panatilihin ang pagkakaroon ng kamakailang impormasyon ng LLMs, at isang buong ecosystem ng vector databases, embedding models, at retrieval pipelines ang nabuo palibot dito. Kung mas epektibo ang paraan ng MeMo sa mas malaking iskala, ang ilan sa mga infrastruktura na ito ay maaaring maging mas kaunti ang kahalagahan.

Isang panganib na dapat tandaan: Ang mga benchmark ng MeMo ay ginawa sa akademikong dataset. Maaaring magkaiba ang real-world na performance sa malikot at adversarial na mga kapaligiran tulad ng crypto markets.