MIT کا MeMo فریم ورک LLM کی کارکردگی کو 26% بڑھاتا ہے

ایک بڑے زبان ماڈل کو اس کے تربیت کے بعد کچھ نیا سکھانا، بخشنے کے ساتھ کہنا تو، ایک دشواری ہے۔ آپ یا تو پورا ماڈل دوبارہ تربیت دیں (مہنگا)، یا دستاویزات کو اس کے حوالہ کی ونڈو میں ڈال دیں (محدود)، یا ایسے ریٹریول سسٹم لگائیں جو اکثر پیچیدہ سوالات پر پھنس جاتے ہیں۔ MIT CSAIL، سنگاپور کے قومی یونیورسٹی، اور A*STAR کے محققین نے ایک فریم ورک جاری کیا ہے جو تینوں مسائل سے بچ جاتا ہے۔

یہ فریم ورک MeMo کہلاتا ہے، جو Memory as a Model کا مختصر رูپ ہے۔ اس کی تفصیل 20 مئی، 2026 کو جاری کیے گئے ایک پیپر (arXiv:2605.15156) میں دی گئی ہے، اور مرکزی خیال انتہائی سادہ ہے: موجودہ LLM میں نئی معلومات ڈالنے کے بجائے، ایک الگ، چھوٹا مدل تربیت دیا جائے جس کا واحد کام چیزوں کو یاد رکھنا ہو۔ بنیادی LLM منجمد رہتا ہے۔ جب اسے جوابات کی ضرورت ہوتی ہے تو وہ صرف میموری مدل سے سوالات پوچھتا ہے۔

MeMo کیسے کام کرتا ہے

ٹیکنیکل طور پر، MeMo نئے دائرہ کار کی معلومات پر میموری ماڈل کو تربیت دینے کے لیے ایک پانچ مرحلہ ریفلیکشن QA سنتھیسس پائپ لائن استعمال کرتا ہے۔ انفرنس کے وقت، فرزن ایگزیکٹو LLM، جیسے کہ Qwen2.5 یا Gemini-3-Flash، میموری ماڈل کو ایک ساخت شدہ متعدد مکالمہ پروٹوکول کے ذریعے دریافت کرتا ہے۔ میموری ماڈل صرف ٹیکسٹ چنکس کو ریٹریو نہیں کرتا بلکہ معلومات کو انٹرنلائز کرتا ہے، جو اسے روایتی ریٹریول-آگمنٹڈ جنریشن (RAG) سیٹ اپس سے الگ کرتا ہے۔

یہ ساخت تباہ کن بھول جانے سے بچاتی ہے، جس میں نیویرل نیٹ ورک کو نئے ڈیٹا پر اپ ڈیٹ کرنے سے پہلے سیکھی گئی صلاحیتیں ضائع ہو جاتی ہیں۔ اس کا مطلب یہ بھی ہے کہ جب نئی معلومات آئیں تو آپ کو بڑے، مہنگے ایگزیکٹو ماڈل کو دوبارہ ٹیون نہیں کرنا پڑتا۔ آپ صرف چھوٹے میموری ماڈل کو اپ ڈیٹ کرتے ہیں۔

اعلان

براؤزکمپ-پلس، نیاریٹووکا، اور مو سیک کے ڈیٹا سیٹس پر کیے گئے معیاری ٹیسٹوں نے ظاہر کیا کہ جب تحقیق کاروں نے ایگزیکٹو ماڈلز کو جیمینی-3-فلیش پر تبدیل کیا، تو ان کی کارکردگی میں 26.73% تک کا بہتری آئی، جبکہ میموری کمپوننٹ کو دوبارہ ٹرین نہیں کیا گیا۔ میموری ماڈل، ایک بار ٹرین ہونے کے بعد، جیمینی-3-فلیش سمیت مختلف ایگزیکٹو LLMs کے ساتھ ایک جامع ایڈاپٹر کے طور پر کام کرتا رہا۔

یہ پلگ اینڈ پلے مطابقت دونوں کھلے اور بند سورس LLMs تک پھیلتی ہے۔ آپ ایک بار میموری ماڈل تربیت دے سکتے ہیں اور اسے اپنی تنظیم کے پسندیدہ کسی بھی فرنٹیر ماڈل کے ساتھ ڈپلوی کر سکتے ہیں، یا بہتر ماڈل دستیاب ہونے پر ایگزیکٹو ماڈلز تبدیل کر سکتے ہیں۔ جانکاری لیئر الگ طور پر برقرار رہتی ہے۔

مقابلہ میں، RAG کے اچھی طرح سے دستاویز شدہ کمزوریاں ہیں۔ یہ حاصل کردہ دستاویزات میں شور کے لیے حساس ہے، متعدد دستاویزات کے استدلال میں مشکل کا شکار ہوتا ہے، اور جب سوالات کو کئی ذرائع سے معلومات کو مربوط کرنے کی ضرورت ہوتی ہے تو اس کی کارکردگی کم ہو جاتی ہے۔ MeMo کا نقطہ نظر، جس میں علم کو ماڈل وزن میں کوڈ کیا جاتا ہے، اس سے خام متن کو حاصل کرنے کے بجائے ان صورتحالوں کا زیادہ مضبوط طریقے سے مقابلہ ہوتا ہے۔

کریپٹو AI انفراسٹرکچر کے لیے یہ کیوں اہم ہے

میمو تحقیق میں کوئی بلاک چین ٹوکن یا کرپٹو خاص منصوبے نہیں درج ہیں۔ آئیے اس بات کو شروع میں ہی واضح کر لیں۔

آن-چین تجزیہ سب سے واضح استعمال کی صورت میں سے ایک ہے۔ DeFi پروٹوکولز کی نگرانی کرنے والے، والٹ سرگرمیوں کا پیگھل کرنے والے، یا مشکوک لین دین کو نشان زد کرنے والے AI ایجنسز کو نئے معاہدوں، حکومتی پیشکشوں اور بازار کی صورتحال کے بارے میں مستقل اپڈیٹڈ معلومات کی ضرورت ہوتی ہے۔ ایک MeMo سٹائل کی ساخت DeFi تجزیہ ایجنس کو اس کے میموری ماڈل میں مستقل، اپڈیٹ کرنا یا تبدیل کرنا ممکن جانکاری کا ذخیرہ رکھنے دے سکتی ہے، جبکہ وہ اس سب سے آگے کے LLM کے ذریعہ استنباط کرتا رہے جو بہترین استدلال کی صلاحیت فراہم کرتا ہو۔ جب کوئی پروٹوکول اپنے پیرامیٹرز تبدیل کرتا ہے، تو آپ میموری ماڈل کو اپڈیٹ کرتے ہیں۔ ایگزیکٹو بنا رہتا ہے۔

آپریشنل لاگت کا پہلو اہم ہے۔ بڑے ماڈلز کو دوبارہ ٹرین کرنا AI-نیٹو کریپٹو ایپلیکیشنز کے لیے سب سے بڑے خرچوں میں سے ایک ہے، اور یہ ایک دہرائی جانے والی لاگت ہے جو بنیادی ڈیٹا کے تبدیل ہونے کی اکھڑ کے ساتھ بڑھتی ہے۔ ایک ایسا فریم ورک جو ٹریننگ کو ختم کر دے اور کارکردگی کو برقرار رکھے یا بہتر بنائے، تو تفصیلی AI ایجینٹس چلانے کی لاگت کو معنی خیز طور پر کم کر سکتا ہے۔

جو چیزیں سرمایہ کاروں کو دیکھنی چاہییں

RAG کو LLMs کو تازہ رکھنے کے لیے ڈیفالٹ طریقہ کے طور پر استعمال کیا جا رہا ہے، اور اس کے ارد گرد ویکٹر ڈیٹا بیسز، ایم بیڈنگ ماڈلز، اور ریٹریول پائپ لائنز کا ایک پورا ایکو سسٹم تعمیر کیا گیا ہے۔ اگر MeMo کا طریقہ بڑے پیمانے پر زیادہ موثر ثابت ہوا، تو ان میں سے کچھ بنیادی ڈھانچہ کم ضروری ہو جائے گا۔

ایک خطرہ جس کا ذکر کیا جانا چاہیے: میمو کے بینچ مارکس اکیڈمک ڈیٹا سیٹس پر کیے گئے تھے۔ اصل دنیا کی کارکردگی، جیسے کرپٹو مارکیٹس جیسے شور اور ضدی ماحول میں، مختلف ہو سکتی ہے۔