Framework MeMo dari MIT Meningkatkan Kinerja LLM sebesar 26%

Mengajarkan sesuatu yang baru kepada model bahasa besar setelah dilatih, dengan cara yang baik, adalah hal yang merepotkan. Anda harus melatih ulang seluruh model (mahal), memasukkan dokumen ke dalam jendela konteksnya (terbatas), atau menambahkan sistem pencarian yang sering gagal menangani pertanyaan kompleks. Peneliti dari MIT CSAIL, Universitas Nasional Singapura, dan A*STAR baru saja mempublikasikan kerangka kerja yang menghindari ketiga masalah ini.

Framework ini disebut MeMo, singkatan dari Memory as a Model. Ini dijelaskan secara rinci dalam sebuah makalah yang dirilis pada 20 Mei 2026 (arXiv:2605.15156), dan ide intinya sangat elegan dan sederhana: alih-alih memaksa pengetahuan baru ke dalam LLM yang sudah ada, latih model terpisah yang lebih kecil yang tugasnya hanya mengingat hal-hal. LLM utama tetap beku. Ia hanya mengajukan pertanyaan ke model memori saat membutuhkan jawaban.

Bagaimana MeMo sebenarnya bekerja

Dalam istilah teknis, MeMo menggunakan pipeline sintesis QA refleksi lima langkah untuk melatih model Memory pada pengetahuan domain baru. Pada waktu inferensi, Executive LLM yang dibekukan, seperti Qwen2.5 atau Gemini-3-Flash, mengajukan pertanyaan ke model Memory melalui protokol multi-sesi terstruktur. Model Memory menginternalisasi informasi tersebut, bukan hanya mengambil potongan teks, yang membedakannya dari pengaturan tradisional retrieval-augmented generation (RAG).

Arsitektur ini menghindari catastrophic forgetting, fenomena di mana pembaruan jaringan saraf pada data baru menyebabkan hilangnya kemampuan yang sebelumnya dipelajari. Ini juga berarti Anda tidak perlu menyetel ulang model Executive yang besar dan mahal ketika informasi baru datang. Anda cukup memperbarui model Memori yang lebih kecil.

Uji coba yang dilakukan pada kumpulan data termasuk BrowseComp-Plus, NarrativeQA, dan MuSiQue menunjukkan peningkatan kinerja hingga 26,73% ketika para peneliti beralih dari model Executive ke Gemini-3-Flash, tanpa melatih ulang komponen Memory. Model Memory, setelah dilatih, berfungsi di berbagai LLM Executive seperti adapter universal.

Kompatibilitas plug-and-play ini berlaku untuk kedua LLM sumber terbuka dan tertutup. Anda dapat melatih model Memori sekali saja dan menggunakannya dengan model frontier pilihan organisasi Anda, atau mengganti model Eksekutif saat model yang lebih baik tersedia. Lapisan pengetahuan tetap ada secara independen.

RAG, sebaliknya, memiliki kelemahan yang terdokumentasi dengan baik. RAG sensitif terhadap kebisingan dalam dokumen yang diambil, kesulitan dalam penalaran multi-dokumen, dan menurun ketika pertanyaan memerlukan sintesis informasi dari banyak sumber. Pendekatan MeMo yang mengkodekan pengetahuan ke dalam bobot model daripada mengambil teks mentah tampaknya menangani skenario-skenario ini dengan lebih kuat.

Mengapa hal ini penting untuk infrastruktur AI kripto

Tidak ada token blockchain atau proyek khusus kripto yang disebutkan dalam penelitian MeMo. Mari kita jelas tentang hal itu sejak awal.

Analisis on-chain adalah salah satu kasus penggunaan yang paling jelas. Agen AI yang memantau protokol DeFi, melacak aktivitas dompet, atau menandai transaksi mencurigakan memerlukan pengetahuan yang terus diperbarui tentang kontrak baru, usulan tata kelola, dan kondisi pasar. Arsitektur gaya MeMo memungkinkan agen analisis DeFi mempertahankan penyimpanan pengetahuan yang persisten dan dapat diperbarui di model Memori-nya sambil menjalankan inferensi melalui LLM terkini yang menawarkan kemampuan penalaran terbaik. Ketika protokol mengubah parameternya, Anda memperbarui model Memori. Eksekutif tetap tidak berubah.

Sudut biaya operasional signifikan. Pelatihan ulang model besar merupakan salah satu biaya terbesar untuk aplikasi kripto berbasis AI, dan ini adalah biaya berulang yang meningkat seiring frekuensi perubahan data dasar. Sebuah kerangka kerja yang menghilangkan pelatihan ulang sambil mempertahankan atau meningkatkan kinerja dapat secara signifikan mengurangi biaya menjalankan agen AI canggih.

Apa yang harus diwaspadai oleh investor

RAG telah menjadi pendekatan baku untuk menjaga agar LLM tetap mutakhir, dan seluruh ekosistem database vektor, model embedding, dan pipeline pengambilan informasi telah dibangun di sekitarnya. Jika pendekatan MeMo terbukti lebih efektif dalam skala besar, sebagian infrastruktur tersebut menjadi kurang penting.

Satu risiko yang perlu diperhatikan: pengujian MeMo dilakukan pada dataset akademis. Kinerja di dunia nyata di lingkungan yang penuh kebisingan dan adversarial, seperti pasar kripto, bisa berbeda.