إطار عمل MeMo من MIT يزيد أداء نماذج اللغة الكبيرة بنسبة 26%

تعليم نموذج لغوي كبير شيء جديد بعد تدريبه، بلغة متحفظة، أمر متعب. إما أنك تعيد تدريبه بالكامل (مكلف)، أو تُدخل وثائق إلى نافذة سياقه (محدودة)، أو تضيف أنظمة استرجاع تتعثر غالبًا مع الاستعلامات المعقدة. نشر باحثون من معهد ماساتشوستس للتكنولوجيا CSAIL، والجامعة الوطنية السنغافورية، وA*STAR إطارًا يتجنب جميع هذه المشاكل الثلاث.

يُسمى الإطار MeMo، وهو اختصار لـ Memory as a Model. تم تفصيله في ورقة صدرت في 20 مايو 2026 (arXiv:2605.15156)، والفكرة الأساسية بسيطة وأنيقة: بدلاً من فرض معرفة جديدة على نموذج LLM موجود، قم بتدريب نموذج منفصل وأصغر تكون وظيفته الوحيدة هي تذكر الأشياء. يبقى النموذج الرئيسي ثابتًا. إنه يطرح أسئلة على نموذج الذاكرة فقط عندما يحتاج إلى إجابات.

كيف يعمل MeMo فعليًا

من الناحية التقنية، يستخدم MeMo خطوات خمسية في أنبوب توليد أسئلة وأجوبة مع التأمل لتدريب نموذج الذاكرة على معرفة مجالات جديدة. أثناء الاستدلال، يستفسر نموذج Executive المجمد، مثل Qwen2.5 أو Gemini-3-Flash، نموذج الذاكرة من خلال بروتوكول متعدد المراحل منظم. يقوم نموذج الذاكرة بدمج المعلومات بدلاً من استرجاع كتل نصية فقط، وهو ما يميزه عن إعدادات التوليد المعزز بالاسترجاع التقليدية (RAG).

يتجنب هذا الهيكل النسيان الكارثي، وهي الظاهرة التي تسبب فيها تحديث شبكة عصبية على بيانات جديدة فقدان القدرات المكتسبة سابقًا. كما يعني ذلك أنك لست بحاجة أبدًا لإعادة ضبط النموذج التنفيذي الكبير والمضخم عند وصول معلومات جديدة. ما عليك سوى تحديث نموذج الذاكرة الأصغر.

أظهرت المعايير التي أُجريت على مجموعات بيانات تشمل BrowseComp-Plus وNarrativeQA وMuSiQue تحسينات في الأداء بلغت حتى 26.73% عند تحول الباحثين من نماذج Executive إلى Gemini-3-Flash، دون إعادة تدريب مكون الذاكرة. عمل نموذج الذاكرة، بعد تدريبه، عبر نماذج Executive المختلفة مثل محوّل عالمي.

تمتد هذه التوافقية المدمجة إلى كل من نماذج LLM المفتوحة والمغلقة المصدر. يمكنك تدريب نموذج الذاكرة مرة واحدة ونشره مع أي نموذج متقدم تفضله مؤسستك، أو استبدال نماذج التنفيذ عندما تصبح نماذج أفضل متاحة. تظل طبقة المعرفة مستقلة وثابتة.

على النقيض، فإن RAG لديها نقاط ضعف موثقة جيدًا. فهي حساسة للضوضاء في الوثائق المسترجعة، وتعاني من صعوبات في الاستدلال عبر عدة وثائق، وتتدهور عندما تتطلب الأسئلة دمج المعلومات من مصادر عديدة. يبدو أن نهج MeMo المتمثل في تشفير المعرفة داخل أوزان النموذج بدلاً من استرجاع النصوص الخام يتعامل مع هذه السيناريوهات بشكل أكثر متانة.

لماذا هذا مهم لبنية الذكاء الاصطناعي للعملات المشفرة

لا تُذكر أي رموز بلوكشين أو مشاريع متعلقة بالعملات المشفرة في بحث MeMo. دعونا نكون واضحين في هذا الصدد من البداية.

تحليل السلسلة هو أحد أكثر حالات الاستخدام وضوحًا. تحتاج وكلاء الذكاء الاصطناعي الذين يراقبون بروتوكولات DeFi، أو تتبع نشاط المحافظ، أو تُشير إلى المعاملات المشبوهة إلى معرفة محدثة باستمرار حول العقود الجديدة، ومقترحات الحوكمة، وظروف السوق. يمكن لهيكلية على غرار MeMo أن تسمح لوكيل تحليل DeFi بالاحتفاظ بمخزن معرفي مستمر وقابل للتحديث في نموذج الذاكرة الخاص به أثناء تنفيذ الاستدلال من خلال أي نموذج LLM متقدم يوفر أفضل قدرات الاستنتاج. عندما يتغير بروتوكول معلماته، تقوم بتحديث نموذج الذاكرة. يبقى المدير دون تغيير.

جانب التكلفة التشغيلية مهم. إعادة تدريب النماذج الكبيرة هي واحدة من أكبر المصروفات لتطبيقات العملات المشفرة الأصلية التي تعتمد على الذكاء الاصطناعي، وهي تكلفة متكررة تزداد مع تكرار تغيير البيانات الأساسية. يمكن لإطار عمل يلغي إعادة التدريب مع الحفاظ على الأداء أو تحسينه أن يقلل بشكل كبير من تكلفة تشغيل وكلاء الذكاء الاصطناعي المتقدمة.

ما يجب على المستثمرين مراقبته

كان RAG النهج الافتراضي للحفاظ على تحديث نماذج اللغة الكبيرة، وقد تم بناء نظام بيئي كامل من قواعد البيانات المتجهية ونماذج التضمين وقنوات الاسترجاع حوله. إذا أثبت نهج MeMo فعاليته بشكل أكبر عند التوسع، فإن بعض هذه البنية التحتية تصبح أقل ضرورة.

خطر واحد يستحق الملاحظة: تم إجراء معايير MeMo على مجموعات بيانات أكاديمية. قد تختلف الأداء في العالم الحقيقي في بيئات ضوضائية ومضادة مثل أسواق التشفير.