إطار عمل MeMo من MIT يزيد أداء نماذج اللغة الكبيرة بنسبة 26%

iconCryptoBriefing
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
كشف باحثون من معهد ماساتشوستس للتكنولوجيا، إلى جانب فرق من سنغافورة وA*STAR، عن الإطار MeMo، الذي يعزز أداء نماذج اللغة الكبيرة بنسبة 26.73% دون إعادة التدريب. يستخدم النظام نموذجًا أصغر لتخزين واسترجاع المعرفة، مع الحفاظ على نموذج اللغة الكبير الرئيسي ثابتًا. يسلط هذا التحديث الإخباري على السلسلة الضوء على المكاسب في مجموعات البيانات مثل BrowseComp-Plus وNarrativeQA، مع التوافق عبر النماذج مفتوحة المصدر ومغلقة المصدر. يتجنب هذا الأسلوب النسيان الكارثي ويمكن أن يستفيد قطاعات الأخبار المشفرة مثل البلوكشين وDeFi، حيث تحتاج وكلاء الذكاء الاصطناعي إلى معرفة محدثة دون إعادة التدريب.

تعليم نموذج لغوي كبير شيء جديد بعد تدريبه، بلغة متحفظة، أمر متعب. إما أنك تعيد تدريبه بالكامل (مكلف)، أو تُدخل وثائق إلى نافذة سياقه (محدودة)، أو تضيف أنظمة استرجاع تتعثر غالبًا مع الاستعلامات المعقدة. نشر باحثون من معهد ماساتشوستس للتكنولوجيا CSAIL، والجامعة الوطنية السنغافورية، وA*STAR إطارًا يتجنب جميع هذه المشاكل الثلاث.

يُسمى الإطار MeMo، وهو اختصار لـ Memory as a Model. تم تفصيله في ورقة صدرت في 20 مايو 2026 (arXiv:2605.15156)، والفكرة الأساسية بسيطة وأنيقة: بدلاً من فرض معرفة جديدة على نموذج LLM موجود، قم بتدريب نموذج منفصل وأصغر تكون وظيفته الوحيدة هي تذكر الأشياء. يبقى النموذج الرئيسي ثابتًا. إنه يطرح أسئلة على نموذج الذاكرة فقط عندما يحتاج إلى إجابات.

كيف يعمل MeMo فعليًا

من الناحية التقنية، يستخدم MeMo خطوات خمسية في أنبوب توليد أسئلة وأجوبة مع التأمل لتدريب نموذج الذاكرة على معرفة مجالات جديدة. أثناء الاستدلال، يستفسر نموذج Executive المجمد، مثل Qwen2.5 أو Gemini-3-Flash، نموذج الذاكرة من خلال بروتوكول متعدد المراحل منظم. يقوم نموذج الذاكرة بدمج المعلومات بدلاً من استرجاع كتل نصية فقط، وهو ما يميزه عن إعدادات التوليد المعزز بالاسترجاع التقليدية (RAG).

يتجنب هذا الهيكل النسيان الكارثي، وهي الظاهرة التي تسبب فيها تحديث شبكة عصبية على بيانات جديدة فقدان القدرات المكتسبة سابقًا. كما يعني ذلك أنك لست بحاجة أبدًا لإعادة ضبط النموذج التنفيذي الكبير والمضخم عند وصول معلومات جديدة. ما عليك سوى تحديث نموذج الذاكرة الأصغر.

إعلان

أظهرت المعايير التي أُجريت على مجموعات بيانات تشمل BrowseComp-Plus وNarrativeQA وMuSiQue تحسينات في الأداء بلغت حتى 26.73% عند تحول الباحثين من نماذج Executive إلى Gemini-3-Flash، دون إعادة تدريب مكون الذاكرة. عمل نموذج الذاكرة، بعد تدريبه، عبر نماذج Executive المختلفة مثل محوّل عالمي.

تمتد هذه التوافقية المدمجة إلى كل من نماذج LLM المفتوحة والمغلقة المصدر. يمكنك تدريب نموذج الذاكرة مرة واحدة ونشره مع أي نموذج متقدم تفضله مؤسستك، أو استبدال نماذج التنفيذ عندما تصبح نماذج أفضل متاحة. تظل طبقة المعرفة مستقلة وثابتة.

على النقيض، فإن RAG لديها نقاط ضعف موثقة جيدًا. فهي حساسة للضوضاء في الوثائق المسترجعة، وتعاني من صعوبات في الاستدلال عبر عدة وثائق، وتتدهور عندما تتطلب الأسئلة دمج المعلومات من مصادر عديدة. يبدو أن نهج MeMo المتمثل في تشفير المعرفة داخل أوزان النموذج بدلاً من استرجاع النصوص الخام يتعامل مع هذه السيناريوهات بشكل أكثر متانة.

لماذا هذا مهم لبنية الذكاء الاصطناعي للعملات المشفرة

لا تُذكر أي رموز بلوكشين أو مشاريع متعلقة بالعملات المشفرة في بحث MeMo. دعونا نكون واضحين في هذا الصدد من البداية.

تحليل السلسلة هو أحد أكثر حالات الاستخدام وضوحًا. تحتاج وكلاء الذكاء الاصطناعي الذين يراقبون بروتوكولات DeFi، أو تتبع نشاط المحافظ، أو تُشير إلى المعاملات المشبوهة إلى معرفة محدثة باستمرار حول العقود الجديدة، ومقترحات الحوكمة، وظروف السوق. يمكن لهيكلية على غرار MeMo أن تسمح لوكيل تحليل DeFi بالاحتفاظ بمخزن معرفي مستمر وقابل للتحديث في نموذج الذاكرة الخاص به أثناء تنفيذ الاستدلال من خلال أي نموذج LLM متقدم يوفر أفضل قدرات الاستنتاج. عندما يتغير بروتوكول معلماته، تقوم بتحديث نموذج الذاكرة. يبقى المدير دون تغيير.

جانب التكلفة التشغيلية مهم. إعادة تدريب النماذج الكبيرة هي واحدة من أكبر المصروفات لتطبيقات العملات المشفرة الأصلية التي تعتمد على الذكاء الاصطناعي، وهي تكلفة متكررة تزداد مع تكرار تغيير البيانات الأساسية. يمكن لإطار عمل يلغي إعادة التدريب مع الحفاظ على الأداء أو تحسينه أن يقلل بشكل كبير من تكلفة تشغيل وكلاء الذكاء الاصطناعي المتقدمة.

ما يجب على المستثمرين مراقبته

كان RAG النهج الافتراضي للحفاظ على تحديث نماذج اللغة الكبيرة، وقد تم بناء نظام بيئي كامل من قواعد البيانات المتجهية ونماذج التضمين وقنوات الاسترجاع حوله. إذا أثبت نهج MeMo فعاليته بشكل أكبر عند التوسع، فإن بعض هذه البنية التحتية تصبح أقل ضرورة.

خطر واحد يستحق الملاحظة: تم إجراء معايير MeMo على مجموعات بيانات أكاديمية. قد تختلف الأداء في العالم الحقيقي في بيئات ضوضائية ومضادة مثل أسواق التشفير.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.