กรอบงาน MeMo ของ MIT เพิ่มประสิทธิภาพของ LLM ขึ้น 26%

การสอนโมเดลภาษาขนาดใหญ่ให้เรียนรู้สิ่งใหม่หลังจากที่ฝึกเสร็จแล้ว ถ้าพูดอย่างสุภาพคือเป็นเรื่องยุ่งยาก คุณต้องฝึกใหม่ทั้งหมด (แพงมาก) ใส่เอกสารเข้าไปในหน้าต่างบริบท (มีข้อจำกัด) หรือติดตั้งระบบการดึงข้อมูลที่มักล้มเหลวเมื่อเจอคำถามซับซ้อน นักวิจัยจาก MIT CSAIL มหาวิทยาลัยแห่งชาติสิงคโปร์ และ A*STAR เพิ่งเผยแพร่กรอบงานที่หลีกเลี่ยงปัญหาทั้งสามข้อนี้

กรอบงานนี้เรียกว่า MeMo ย่อจาก Memory as a Model ซึ่งได้รับการอธิบายอย่างละเอียดในเอกสารที่เผยแพร่เมื่อวันที่ 20 พฤษภาคม 2026 (arXiv:2605.15156) และแนวคิดหลักนั้นเรียบง่ายอย่างสง่างาม: แทนที่จะบังคับให้ความรู้ใหม่เข้าไปใน LLM ที่มีอยู่แล้ว ให้ฝึกโมเดลเล็กๆ ที่แยกต่างหากซึ่งมีหน้าที่เพียงแค่จดจำสิ่งต่างๆ โมเดล LLM หลักจะถูกคงไว้ไม่เปลี่ยนแปลง โดยจะเพียงแค่ถามคำถามกับโมเดลความจำเมื่อต้องการคำตอบ

วิธีการทำงานของ MeMo

ในเชิงเทคนิค MeMo ใช้กระบวนการสังเคราะห์ QA แบบสะท้อนห้าขั้นตอนในการฝึกโมเดลความจำด้วยความรู้ในโดเมนใหม่ ในช่วงการประมวลผล โมเดล Executive LLM ที่ถูกล็อก เช่น Qwen2.5 หรือ Gemini-3-Flash จะสอบถามโมเดลความจำผ่านโปรโตคอลหลายรอบที่มีโครงสร้าง โมเดลความจำจะยึดถือข้อมูลไว้ภายในแทนที่จะแค่ดึงข้อมูลเป็นชิ้นส่วนข้อความ ซึ่งเป็นจุดที่แตกต่างจากโครงสร้างการสร้างแบบเสริมการดึงข้อมูลแบบดั้งเดิม (RAG)

สถาปัตยกรรมนี้หลีกเลี่ยงการลืมอย่างรุนแรง ซึ่งเป็นปรากฏการณ์ที่การอัปเดตเครือข่ายประสาทเทียมด้วยข้อมูลใหม่ทำให้สูญเสียความสามารถที่เรียนรู้มาแล้วก่อนหน้านี้ นอกจากนี้ยังหมายความว่าคุณไม่จำเป็นต้องปรับแต่งโมเดลผู้บริหารที่ใหญ่และมีต้นทุนสูงอีกครั้งเมื่อมีข้อมูลใหม่เข้ามา คุณแค่อัปเดตโมเดลความจำที่เล็กกว่าเท่านั้น

โฆษณา

การทดสอบแบบเปรียบเทียบบนชุดข้อมูลที่รวมถึง BrowseComp-Plus, NarrativeQA และ MuSiQue แสดงให้เห็นถึงการปรับปรุงประสิทธิภาพสูงสุดถึง 26.73% เมื่อนักวิจัยเปลี่ยนโมเดล Executive เป็น Gemini-3-Flash โดยไม่ต้องฝึกโมเดล Memory อีกครั้ง โมเดล Memory หลังจากถูกฝึกแล้ว สามารถทำงานร่วมกับ Executive LLM ต่างๆ ได้เหมือนตัวปรับใช้แบบสากล

ความเข้ากันได้แบบปลั๊กแอนด์เพลย์นี้ขยายไปถึง LLM ที่เปิดและปิดซอร์ส คุณสามารถฝึกโมเดล Memory เพียงครั้งเดียวแล้วนำไปใช้งานร่วมกับโมเดลชั้นนำที่องค์กรของคุณเลือก หรือเปลี่ยนโมเดล Executive เมื่อมีรุ่นที่ดีกว่าปรากฏขึ้น ชั้นความรู้จะคงอยู่อย่างอิสระ

ในทางตรงกันข้าม RAG มีจุดอ่อนที่ได้รับการบันทึกไว้อย่างชัดเจน มันไวต่อสัญญาณรบกวนในเอกสารที่ดึงมา ยากต่อการให้เหตุผลข้ามเอกสารหลายฉบับ และประสิทธิภาพลดลงเมื่อคำถามต้องการสังเคราะห์ข้อมูลจากแหล่งหลายแห่ง วิธีการของ MeMo ที่เข้ารหัสความรู้ลงในน้ำหนักของโมเดลแทนการดึงข้อความดิบ ดูเหมือนจะจัดการกับสถานการณ์เหล่านี้ได้อย่างมั่นคงกว่า

เหตุผลที่สิ่งนี้มีความสำคัญต่อโครงสร้างพื้นฐาน AI สำหรับคริปโต

ไม่มีโทเค็นบล็อกเชนหรือโครงการที่เกี่ยวข้องกับคริปโตใดๆ ถูกกล่าวถึงในการวิจัย MeMo ขอชี้แจงให้ชัดเจนตั้งแต่ต้น

การวิเคราะห์บนโซ่เป็นหนึ่งในกรณีการใช้งานที่ชัดเจนที่สุด ตัวแทน AI ที่ติดตามโปรโตคอล DeFi ติดตามกิจกรรมวอลเล็ต หรือแจ้งเตือนธุรกรรมที่น่าสงสัย ต้องการข้อมูลที่อัปเดตอย่างต่อเนื่องเกี่ยวกับสัญญาใหม่ ข้อเสนอการกำกับดูแล และเงื่อนไขตลาด สถาปัตยกรรมแบบ MeMo สามารถช่วยให้ตัวแทนวิเคราะห์ DeFi รักษาคลังความรู้ที่คงอยู่และอัปเดตได้ในโมเดลหน่วยความจำของมัน ในขณะที่ดำเนินการอนุมานผ่าน LLM รุ่นล่าสุดที่มีความสามารถในการให้เหตุผลดีที่สุด เมื่อโปรโตคอลเปลี่ยนพารามิเตอร์ของมัน คุณจะอัปเดตโมเดลหน่วยความจำ ส่วนผู้บริหารจะไม่ถูกเปลี่ยนแปลง

มุมมองด้านต้นทุนการดำเนินงานมีความสำคัญอย่างมาก การฝึกโมเดลขนาดใหญ่ซ้ำอีกครั้งเป็นหนึ่งในค่าใช้จ่ายที่ใหญ่ที่สุดสำหรับแอปพลิเคชันคริปโตที่ออกแบบมาเพื่อปัญญาประดิษฐ์โดยตรง และเป็นต้นทุนที่เกิดซ้ำและเพิ่มขึ้นตามความถี่ของการเปลี่ยนแปลงของข้อมูลพื้นฐาน โครงร่างที่สามารถกำจัดการฝึกซ้ำได้ในขณะที่ยังคงหรือปรับปรุงประสิทธิภาพ อาจช่วยลดต้นทุนในการดำเนินการตัวแทนปัญญาประดิษฐ์ที่ซับซ้อนได้อย่างมีนัยสำคัญ

สิ่งที่นักลงทุนควรติดตาม

RAG ได้รับการใช้เป็นวิธีมาตรฐานในการทำให้ LLMs อัปเดตข้อมูลล่าสุด และได้มีการสร้างระบบนิเวศทั้งหมดของฐานข้อมูลเวกเตอร์ แบบจำลองการฝังตัว และกระบวนการดึงข้อมูลรอบๆ มัน หากวิธีของ MeMo พิสูจน์ว่ามีประสิทธิภาพมากกว่าเมื่อขยายขนาด โครงสร้างพื้นฐานบางส่วนเหล่านี้อาจไม่จำเป็นอีกต่อไป

ความเสี่ยงหนึ่งที่ควรสังเกต: การทดสอบประสิทธิภาพของ MeMo ดำเนินการบนชุดข้อมูลทางวิชาการ ประสิทธิภาพในโลกจริงในสภาพแวดล้อมที่มีสัญญาณรบกวนและเป็นศัตรู เช่น ตลาดคริปโต อาจแตกต่างกัน