Rangka Kerja MeMo MIT Meningkatkan Prestasi LLM sebanyak 26%

iconCryptoBriefing
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Penyelidik MIT, bersama pasukan dari Singapura dan A*STAR, memperkenalkan kerangka MeMo, yang meningkatkan prestasi LLM sebanyak 26.73% tanpa perlu latihan semula. Sistem ini menggunakan model yang lebih kecil untuk menyimpan dan mengambil pengetahuan, sambil mengekalkan LLM utama dalam keadaan beku. Kemas kini berita di blok rantai ini menonjolkan keuntungan pada set data seperti BrowseComp-Plus dan NarrativeQA, dengan kompatibiliti di antara model sumber terbuka dan tertutup. Kaedah ini mengelakkan pelupaan bencana dan boleh memberi manfaat kepada sektor berita kripto seperti blok rantai dan DeFi, di mana agen AI memerlukan pengetahuan yang dikemaskini tanpa perlu latihan semula.

Mengajar model bahasa besar sesuatu yang baru selepas ia dilatih, dengan cara yang paling baik dikatakan, merupakan satu cabaran. Anda perlu melatih semula keseluruhan model (mahal), memasukkan dokumen ke dalam tetingkap konteksnya (terhad), atau menambah sistem pengambilan yang sering mengalami masalah dengan soalan yang kompleks. Penyelidik dari MIT CSAIL, Universiti Kebangsaan Singapura, dan A*STAR baru sahaja menerbitkan satu kerangka yang mengelakkan ketiga-tiga masalah ini.

Rangka kerja ini dipanggil MeMo, singkatan bagi Memory as a Model. Ia diterangkan dalam sebuah kertas yang dikeluarkan pada 20 Mei 2026 (arXiv:2605.15156), dan idea utamanya adalah sangat elegan: bukannya memaksa pengetahuan baru ke dalam LLM yang sedia ada, latih model kecil yang berasingan yang tugasnya hanya untuk mengingat perkara-perkara. LLM utama kekal beku. Ia hanya bertanya soalan kepada model ingatan apabila memerlukan jawapan.

Bagaimana MeMo berfungsi sebenarnya

Dalam istilah teknikal, MeMo menggunakan pipeline sintesis QA refleksi lima langkah untuk melatih model Memori dengan pengetahuan domain baru. Pada masa inferens, LLM Eksekutif yang dibekukan, seperti Qwen2.5 atau Gemini-3-Flash, mengemukakan soalan kepada model Memori melalui protokol pelbagai gilir yang terstruktur. Model Memori menginternalisasi maklumat tersebut, bukan sekadar mengambil semula potongan teks, yang menjadi ciri pembezanya daripada pengaturan generasi yang diperkaya dengan penarikan semula (RAG) tradisional.

Arsitektur ini mengelakkan pelupaan bencana, fenomena di mana pengemaskinian rangkaian saraf dengan data baru menyebabkan ia kehilangan kemampuan yang telah dipelajari sebelumnya. Ia juga bermakna anda tidak pernah perlu menyesuaikan semula model Eksekutif yang besar dan mahal apabila maklumat baru datang. Anda hanya perlu mengemaskinikan model Memori yang lebih kecil.

Iklan

Ujian berpangkalan pada set data termasuk BrowseComp-Plus, NarrativeQA, dan MuSiQue menunjukkan peningkatan prestasi sehingga 26.73% apabila penyelidik menukar model Eksekutif kepada Gemini-3-Flash, tanpa melatih semula komponen Memori. Model Memori, sekali dilatih, berfungsi di pelbagai LLM Eksekutif seperti penyesuai universal.

Kompatibilitas pasang dan gunakan ini meluas kepada kedua-dua LLM sumber terbuka dan sumber tertutup. Anda boleh melatih model Memori sekali sahaja dan menghantarinya bersama model hadapan yang disukai oleh organisasi anda, atau menukar model Eksekutif apabila model yang lebih baik tersedia. Lapisan pengetahuan kekal secara berasingan.

RAG, sebaliknya, mempunyai kelemahan yang terdokumentasi dengan baik. Ia peka terhadap gangguan dalam dokumen yang diperoleh, mengalami kesukaran dalam penalaran berdasarkan banyak dokumen, dan menurun apabila soalan memerlukan sintesis maklumat daripada banyak sumber. Pendekatan MeMo yang mengenkod pengetahuan ke dalam berat model berbanding mengambil teks mentah kelihatan lebih kukuh dalam menangani senario ini.

Mengapa ini penting untuk infrastruktur AI kripto

Tiada token blok rantai atau projek khusus kripto yang disebut dalam penyelidikan MeMo. Mari kita jelas tentang itu dari awal.

Analisis pada rantai adalah salah satu kesan guna yang paling jelas. Agen AI yang memantau protokol DeFi, melacak aktiviti dompet, atau menandai transaksi mencurigakan memerlukan pengetahuan yang sentiasa dikemas kini mengenai kontrak baru, cadangan tata tertib, dan keadaan pasaran. Arsitektur gaya MeMo boleh membolehkan agen analisis DeFi mengekalkan storan pengetahuan yang berterusan dan boleh dikemas kini dalam model Memori semasa menjalankan inferens melalui LLM terkini yang menawarkan kemampuan penalaran terbaik. Apabila protokol mengubah parameterannya, anda mengemas kini model Memori. Eksekutif tetap tidak berubah.

Sudut kos operasi adalah signifikan. Mentrain semula model besar adalah salah satu perbelanjaan terbesar untuk aplikasi kripto berasaskan AI, dan ia adalah kos berulang yang meningkat mengikut kekerapan perubahan data asas. Sebuah kerangka yang menghilangkan keperluan untuk mentrain semula sambil mengekalkan atau meningkatkan prestasi boleh mengurangkan kos secara bermakna dalam menjalankan agen AI yang canggih.

Apa yang perlu diperhatikan oleh pelabur

RAG telah menjadi pendekatan laluan untuk mengekalkan LLM tetap semasa, dan seluruh ekosistem pangkalan data vektor, model penyemat, dan saluran penarikan telah dibina di sekelilingnya. Jika pendekatan MeMo membuktikan lebih berkesan pada skala yang lebih besar, sebahagian infrastruktur itu menjadi kurang penting.

Satu risiko yang perlu diperhatikan: ukuran MeMo dijalankan pada set data akademik. Prestasi dunia nyata dalam persekitaran bising dan bermusuhan seperti pasaran kripto mungkin berbeza.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.