Rangka Kerja MeMo MIT Meningkatkan Prestasi LLM sebanyak 26%

Mengajar model bahasa besar sesuatu yang baru selepas ia dilatih, dengan cara yang paling baik dikatakan, merupakan satu cabaran. Anda perlu melatih semula keseluruhan model (mahal), memasukkan dokumen ke dalam tetingkap konteksnya (terhad), atau menambah sistem pengambilan yang sering mengalami masalah dengan soalan yang kompleks. Penyelidik dari MIT CSAIL, Universiti Kebangsaan Singapura, dan A*STAR baru sahaja menerbitkan satu kerangka yang mengelakkan ketiga-tiga masalah ini.

Rangka kerja ini dipanggil MeMo, singkatan bagi Memory as a Model. Ia diterangkan dalam sebuah kertas yang dikeluarkan pada 20 Mei 2026 (arXiv:2605.15156), dan idea utamanya adalah sangat elegan: bukannya memaksa pengetahuan baru ke dalam LLM yang sedia ada, latih model kecil yang berasingan yang tugasnya hanya untuk mengingat perkara-perkara. LLM utama kekal beku. Ia hanya bertanya soalan kepada model ingatan apabila memerlukan jawapan.

Bagaimana MeMo berfungsi sebenarnya

Dalam istilah teknikal, MeMo menggunakan pipeline sintesis QA refleksi lima langkah untuk melatih model Memori dengan pengetahuan domain baru. Pada masa inferens, LLM Eksekutif yang dibekukan, seperti Qwen2.5 atau Gemini-3-Flash, mengemukakan soalan kepada model Memori melalui protokol pelbagai gilir yang terstruktur. Model Memori menginternalisasi maklumat tersebut, bukan sekadar mengambil semula potongan teks, yang menjadi ciri pembezanya daripada pengaturan generasi yang diperkaya dengan penarikan semula (RAG) tradisional.

Arsitektur ini mengelakkan pelupaan bencana, fenomena di mana pengemaskinian rangkaian saraf dengan data baru menyebabkan ia kehilangan kemampuan yang telah dipelajari sebelumnya. Ia juga bermakna anda tidak pernah perlu menyesuaikan semula model Eksekutif yang besar dan mahal apabila maklumat baru datang. Anda hanya perlu mengemaskinikan model Memori yang lebih kecil.

Ujian berpangkalan pada set data termasuk BrowseComp-Plus, NarrativeQA, dan MuSiQue menunjukkan peningkatan prestasi sehingga 26.73% apabila penyelidik menukar model Eksekutif kepada Gemini-3-Flash, tanpa melatih semula komponen Memori. Model Memori, sekali dilatih, berfungsi di pelbagai LLM Eksekutif seperti penyesuai universal.

Kompatibilitas pasang dan gunakan ini meluas kepada kedua-dua LLM sumber terbuka dan sumber tertutup. Anda boleh melatih model Memori sekali sahaja dan menghantarinya bersama model hadapan yang disukai oleh organisasi anda, atau menukar model Eksekutif apabila model yang lebih baik tersedia. Lapisan pengetahuan kekal secara berasingan.

RAG, sebaliknya, mempunyai kelemahan yang terdokumentasi dengan baik. Ia peka terhadap gangguan dalam dokumen yang diperoleh, mengalami kesukaran dalam penalaran berdasarkan banyak dokumen, dan menurun apabila soalan memerlukan sintesis maklumat daripada banyak sumber. Pendekatan MeMo yang mengenkod pengetahuan ke dalam berat model berbanding mengambil teks mentah kelihatan lebih kukuh dalam menangani senario ini.

Mengapa ini penting untuk infrastruktur AI kripto

Tiada token blok rantai atau projek khusus kripto yang disebut dalam penyelidikan MeMo. Mari kita jelas tentang itu dari awal.

Analisis pada rantai adalah salah satu kesan guna yang paling jelas. Agen AI yang memantau protokol DeFi, melacak aktiviti dompet, atau menandai transaksi mencurigakan memerlukan pengetahuan yang sentiasa dikemas kini mengenai kontrak baru, cadangan tata tertib, dan keadaan pasaran. Arsitektur gaya MeMo boleh membolehkan agen analisis DeFi mengekalkan storan pengetahuan yang berterusan dan boleh dikemas kini dalam model Memori semasa menjalankan inferens melalui LLM terkini yang menawarkan kemampuan penalaran terbaik. Apabila protokol mengubah parameterannya, anda mengemas kini model Memori. Eksekutif tetap tidak berubah.

Sudut kos operasi adalah signifikan. Mentrain semula model besar adalah salah satu perbelanjaan terbesar untuk aplikasi kripto berasaskan AI, dan ia adalah kos berulang yang meningkat mengikut kekerapan perubahan data asas. Sebuah kerangka yang menghilangkan keperluan untuk mentrain semula sambil mengekalkan atau meningkatkan prestasi boleh mengurangkan kos secara bermakna dalam menjalankan agen AI yang canggih.

Apa yang perlu diperhatikan oleh pelabur

RAG telah menjadi pendekatan laluan untuk mengekalkan LLM tetap semasa, dan seluruh ekosistem pangkalan data vektor, model penyemat, dan saluran penarikan telah dibina di sekelilingnya. Jika pendekatan MeMo membuktikan lebih berkesan pada skala yang lebih besar, sebahagian infrastruktur itu menjadi kurang penting.

Satu risiko yang perlu diperhatikan: ukuran MeMo dijalankan pada set data akademik. Prestasi dunia nyata dalam persekitaran bising dan bermusuhan seperti pasaran kripto mungkin berbeza.