MIT'nin MeMo Çerçevesi, DİL Performansını %26 Artırıyor

iconCryptoBriefing
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
MIT araştırmacıları, Singapur ve A*STAR takımlarıyla birlikte, yeniden eğitme olmadan LLM performansını %26,73 artıran MeMo çerçevesini duyurdu. Sistem, ana LLM’yi dondurarak daha küçük bir model kullanarak bilgi depolamak ve çıkarmak için çalışıyor. Bu blok zinciri üzerindeki haber güncellemesi, BrowseComp-Plus ve NarrativeQA gibi veri kümelerindeki kazanımları vurguluyor ve açık kaynaklı ile kapalı kaynaklı modeller arasında uyumluluğu sağlıyor. Yöntem, katasrofik unutmayı önler ve AI ajantlarının yeniden eğitmeden güncel bilgiye ihtiyaç duyduğu blok zinciri ve DeFi gibi kripto haber sektörlerinde fayda sağlayabilir.

Eğitildikten sonra büyük bir dil modeline yeni bir şey öğretmek, iyimser bir şekilde ifade edersek, bir zorluktur. Ya tüm modeli yeniden eğitmeniz gerekir (pahalı), belgeleri bağlam penceresine sokarsınız (sınırlı), ya da karmaşık sorgularla sıkışan arama sistemleri eklersiniz. MIT CSAIL, Singapur Ulusal Üniversitesi ve A*STAR’dan araştırmacılar, bu üç sorunun tümünden kaçınan bir çerçeve yayınladı.

Çerçeve adı MeMo, yani Bellek, Bir Model Olarak. 20 Mayıs 2026 tarihinde yayımlanan bir makalede (arXiv:2605.15156) detaylandırıldı ve temel fikir zarifçe basit: yeni bilgileri mevcut bir LLM'ye zorlamak yerine, yalnızca şeyleri hatırlamakla görevli ayrı, daha küçük bir model eğitilir. Ana LLM dondurulur. Cevaplar gerektiğinde bellek modeline sorular sorar.

MeMo'nun nasıl çalıştığını öğrenin

Teknik olarak, MeMo, Bellek modelini yeni bir alan bilgisi üzerinde eğitmek için beş adımlı bir yansıma QA sentez hattı kullanır. Tahmin zamanında, Qwen2.5 veya Gemini-3-Flash gibi donmuş Executive LLM, yapılandırılmış çok aşamalı bir protokol aracılığıyla Bellek modelini sorgular. Bellek modeli, metin parçalarını yalnızca çağırma yerine, bilgiyi içselleştirir; bu, geleneksel geri alma destekli üretimi (RAG) sistemlerinden ayıran özelliktir.

Bu mimari, yeni veriler üzerinde bir sinir ağı güncellendiğinde daha önce öğrenilen yetenekleri kaybetmesine neden olan katasrofik unutma fenomenini önler. Aynı zamanda, yeni bilgiler geldiğinde büyük ve maliyetli Yönetici modelini yeniden ayarlamaya gerek kalmaz. Sadece daha küçük Bellek modelini güncellersiniz.

Reklam

BenchComp-Plus, NarrativeQA ve MuSiQue dahil veri kümeleri üzerinde yapılan testler, araştırmacıların Executive modellerini Gemini-3-Flash'e geçirdiklerinde, Bellek bileşenini yeniden eğitmeden %26,73'e kadar performans artışı sağladığını gösterdi. Bir kez eğitilen Bellek modeli, evrensel bir adaptör gibi farklı Executive LLM'lerde çalıştı.

Bu tak-çalıştır uyumu, hem açık hem de kapalı kaynaklı LLM'lere uzanır. Bir kez bir Bellek modeli eğitebilir ve kurumunuzun tercih ettiği herhangi bir öncü modelle dağıtabilir ya da daha iyi modeller mevcut olduğunda Yönetici modellerini değiştirebilirsiniz. Bilgi katmanı bağımsız olarak kalıcıdır.

RAG ise iyi belgelenmiş zayıflıklara sahiptir. Alınan belgelerdeki gürültüye duyarlıdır, çoklu belge mantık yürütme konusunda zorlanır ve sorular birçok kaynaktan bilgi sentezlemeyi gerektirdiğinde performansı düşer. MeMo’nun bilgiyi ham metin yerine model ağırlıklarına kodlama yaklaşımı, bu senaryolarla daha sağlam bir şekilde başa çıkmaktadır.

Bu, kripto AI altyapısı için neden önemli

MeMo araştırmasında blok zinciri tokenları veya kripto spesifik projelerden hiçbirine yer verilmemiştir. Bunun öncelikle açıkça belirtilmesi gerekir.

Blockchain üzerindeki analiz, en açık kullanım durumlarından biridir. DeFi protokollerini izleyen, cüzdan aktivitesini takip eden veya şüpheli işlemleri işaretleyen AI agenteri, yeni sözleşmeler, yönetim önerileri ve piyasa koşulları hakkında sürekli güncellenmiş bilgiye ihtiyaç duyar. Bir MeMo tarzı mimari, bir DeFi analiz ajanının, en iyi muhakeme yeteneklerini sunan herhangi bir öncü LLM üzerinden çıkarım yaparken, Bellek modelinde kalıcı ve güncellenebilir bir bilgi deposu tutmasına izin verebilir. Bir protokol parametrelerini değiştirdiğinde, Bellek modelini güncellersiniz. Yönetici ajan ise değişmeden kalır.

İşletme maliyeti açısı önemli. Büyük modelleri yeniden eğitmek, AI-odaklı kripto uygulamaları için en büyük giderlerden biridir ve temel veriler ne kadar sık değişirse o kadar artan tekrarlayan bir maliyettir. Yeniden eğitimi ortadan kaldırırken performansı koruyan veya geliştiren bir çerçeve, karmaşık AI ajanlarının çalıştırma maliyetini anlamlı şekilde azaltabilir.

Yatırımcıların dikkat etmesi gerekenler

RAG, LLM'leri güncel tutmak için varsayılan yaklaşım olmuştur ve bunun etrafında vektör veritabanları, gömme modelleri ve geri alma işlem hatlarından oluşan bir ekosistem inşa edilmiştir. Eğer MeMo'nun yaklaşımı ölçeklenebilirlikte daha etkili kanıtlanırsa, bu altyapının bazı bileşenleri daha az gerekli hale gelir.

Dikkat edilmesi gereken bir risk: MeMo'nun performans testleri akademik veri kümeleri üzerinde yapılmıştır. Kripto piyasaları gibi gürültülü ve düşmanca ortamlarda gerçek dünya performansı farklı olabilir.

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.