Framework MeMo dari MIT Meningkatkan Kinerja LLM sebesar 26%

iconCryptoBriefing
Bagikan
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Peneliti MIT, bersama tim dari Singapura dan A*STAR, meluncurkan kerangka MeMo, yang meningkatkan kinerja LLM sebesar 26,73% tanpa pelatihan ulang. Sistem ini menggunakan model yang lebih kecil untuk menyimpan dan mengambil pengetahuan, sambil menjaga LLM utama tetap beku. Pembaruan berita on-chain ini menyoroti peningkatan pada dataset seperti BrowseComp-Plus dan NarrativeQA, dengan kompatibilitas di berbagai model sumber terbuka dan tertutup. Metode ini menghindari catastrophic forgetting dan dapat memberikan manfaat bagi sektor berita kripto seperti blockchain dan DeFi, di mana agen AI membutuhkan pengetahuan terbaru tanpa pelatihan ulang.

Mengajarkan sesuatu yang baru kepada model bahasa besar setelah dilatih, dengan cara yang baik, adalah hal yang merepotkan. Anda harus melatih ulang seluruh model (mahal), memasukkan dokumen ke dalam jendela konteksnya (terbatas), atau menambahkan sistem pencarian yang sering gagal menangani pertanyaan kompleks. Peneliti dari MIT CSAIL, Universitas Nasional Singapura, dan A*STAR baru saja mempublikasikan kerangka kerja yang menghindari ketiga masalah ini.

Framework ini disebut MeMo, singkatan dari Memory as a Model. Ini dijelaskan secara rinci dalam sebuah makalah yang dirilis pada 20 Mei 2026 (arXiv:2605.15156), dan ide intinya sangat elegan dan sederhana: alih-alih memaksa pengetahuan baru ke dalam LLM yang sudah ada, latih model terpisah yang lebih kecil yang tugasnya hanya mengingat hal-hal. LLM utama tetap beku. Ia hanya mengajukan pertanyaan ke model memori saat membutuhkan jawaban.

Bagaimana MeMo sebenarnya bekerja

Dalam istilah teknis, MeMo menggunakan pipeline sintesis QA refleksi lima langkah untuk melatih model Memory pada pengetahuan domain baru. Pada waktu inferensi, Executive LLM yang dibekukan, seperti Qwen2.5 atau Gemini-3-Flash, mengajukan pertanyaan ke model Memory melalui protokol multi-sesi terstruktur. Model Memory menginternalisasi informasi tersebut, bukan hanya mengambil potongan teks, yang membedakannya dari pengaturan tradisional retrieval-augmented generation (RAG).

Arsitektur ini menghindari catastrophic forgetting, fenomena di mana pembaruan jaringan saraf pada data baru menyebabkan hilangnya kemampuan yang sebelumnya dipelajari. Ini juga berarti Anda tidak perlu menyetel ulang model Executive yang besar dan mahal ketika informasi baru datang. Anda cukup memperbarui model Memori yang lebih kecil.

Iklan

Uji coba yang dilakukan pada kumpulan data termasuk BrowseComp-Plus, NarrativeQA, dan MuSiQue menunjukkan peningkatan kinerja hingga 26,73% ketika para peneliti beralih dari model Executive ke Gemini-3-Flash, tanpa melatih ulang komponen Memory. Model Memory, setelah dilatih, berfungsi di berbagai LLM Executive seperti adapter universal.

Kompatibilitas plug-and-play ini berlaku untuk kedua LLM sumber terbuka dan tertutup. Anda dapat melatih model Memori sekali saja dan menggunakannya dengan model frontier pilihan organisasi Anda, atau mengganti model Eksekutif saat model yang lebih baik tersedia. Lapisan pengetahuan tetap ada secara independen.

RAG, sebaliknya, memiliki kelemahan yang terdokumentasi dengan baik. RAG sensitif terhadap kebisingan dalam dokumen yang diambil, kesulitan dalam penalaran multi-dokumen, dan menurun ketika pertanyaan memerlukan sintesis informasi dari banyak sumber. Pendekatan MeMo yang mengkodekan pengetahuan ke dalam bobot model daripada mengambil teks mentah tampaknya menangani skenario-skenario ini dengan lebih kuat.

Mengapa hal ini penting untuk infrastruktur AI kripto

Tidak ada token blockchain atau proyek khusus kripto yang disebutkan dalam penelitian MeMo. Mari kita jelas tentang hal itu sejak awal.

Analisis on-chain adalah salah satu kasus penggunaan yang paling jelas. Agen AI yang memantau protokol DeFi, melacak aktivitas dompet, atau menandai transaksi mencurigakan memerlukan pengetahuan yang terus diperbarui tentang kontrak baru, usulan tata kelola, dan kondisi pasar. Arsitektur gaya MeMo memungkinkan agen analisis DeFi mempertahankan penyimpanan pengetahuan yang persisten dan dapat diperbarui di model Memori-nya sambil menjalankan inferensi melalui LLM terkini yang menawarkan kemampuan penalaran terbaik. Ketika protokol mengubah parameternya, Anda memperbarui model Memori. Eksekutif tetap tidak berubah.

Sudut biaya operasional signifikan. Pelatihan ulang model besar merupakan salah satu biaya terbesar untuk aplikasi kripto berbasis AI, dan ini adalah biaya berulang yang meningkat seiring frekuensi perubahan data dasar. Sebuah kerangka kerja yang menghilangkan pelatihan ulang sambil mempertahankan atau meningkatkan kinerja dapat secara signifikan mengurangi biaya menjalankan agen AI canggih.

Apa yang harus diwaspadai oleh investor

RAG telah menjadi pendekatan baku untuk menjaga agar LLM tetap mutakhir, dan seluruh ekosistem database vektor, model embedding, dan pipeline pengambilan informasi telah dibangun di sekitarnya. Jika pendekatan MeMo terbukti lebih efektif dalam skala besar, sebagian infrastruktur tersebut menjadi kurang penting.

Satu risiko yang perlu diperhatikan: pengujian MeMo dilakukan pada dataset akademis. Kinerja di dunia nyata di lingkungan yang penuh kebisingan dan adversarial, seperti pasar kripto, bisa berbeda.

Penafian: Informasi pada halaman ini mungkin telah diperoleh dari pihak ketiga dan tidak mencerminkan pandangan atau opini KuCoin. Konten ini disediakan hanya untuk tujuan informasi umum, tanpa representasi atau jaminan apa pun, dan tidak dapat ditafsirkan sebagai saran keuangan atau investasi. KuCoin tidak bertanggung jawab terhadap segala kesalahan atau kelalaian, atau hasil apa pun yang keluar dari penggunaan informasi ini. Berinvestasi di aset digital dapat berisiko. Harap mengevaluasi risiko produk dan toleransi risiko Anda secara cermat berdasarkan situasi keuangan Anda sendiri. Untuk informasi lebih lanjut, silakan lihat Ketentuan Penggunaan dan Pengungkapan Risiko.