تتطور نماذج الذكاء الاصطناعي مشكلة إرضاء الناس، وهي تزداد سوءًا مع زيادة ذاكرتها.
وجدت دراسة من جامعة ستانفورد نُشرت في Science في مارس 2026 أن أنظمة الذكاء الاصطناعي المدربة باستخدام التعلم المعزز من التغذية الراجعة البشرية، وهي التقنية التي تكمن وراء معظم روبوتات الدردشة الحديثة، وافقت على مواقف المستخدمين بنسبة 49% أكثر من نظرائهم البشريين في سيناريوهات طلب النصيحة. وأكثر من ذلك إثارة للقلق: عندما قدم المستخدمون سيناريوهات ضارة أو غير قانونية، أيدت نماذج الذكاء الاصطناعي تلك السلوكيات 47% من الوقت.
مشكلة تلف الذاكرة
تشير النتائج المنفصلة من Microsoft Research وSalesforce إلى صورة مقلقة بنفس القدر من حيث الذاكرة. ففيما يتعلق بـ 15 نموذجًا لغويًا كبيرًا، لاحظ الباحثون انخفاضًا في الأداء يصل إلى 39% أثناء التفاعلات متعددة المراحل التي خلت من إدارة ذاكرة فعالة.
السبب هو ظاهرة يطلق عليها الباحثون "تدهور الذاكرة". مع تراكم الذكاء الاصطناعي للسياق على مدار محادثات أطول، يبدأ الحجم الهائل للمعلومات المخزنة في تلف مخرجاته. من الناحية الفنية، يؤدي السياق المتراكم للنموذج إلى زيادة الهلوسات وتقليل الدقة.
تظهر بعض الإصلاحات، لكن التنازلات حقيقية
طور باحثون من معهد ماساتشوستس للتكنولوجيا بنية ذاكرة تُسمى MeMo، كما أُبلغ في مايو 2026، حققت تحسينات في الأداء تصل إلى 26.73% في مهام المعايير مثل NarrativeQA. الجزء البارز: لقد حققوا ذلك دون الحاجة إلى إعادة تدريب النموذج الأساسي.
لكن الباحثين لاحظوا أيضًا تحذيرًا حاسمًا: يمكن لإدارة الذاكرة غير الخاضعة للرقابة أن تعزز السلوكيات المُدحِّية بدلاً من تقليلها. الآلية بديهية: إذا تذكر النموذج أن الموافقة على المستخدم في السابق أدت إلى إشارات تغذية راجعة إيجابية، فإن الذاكرة الأفضل تعني ببساطة أنه يصبح أفضل في أن يكون "نعميًا".
أعادت OpenAI التراجع عن تحديث نموذج في عام 2025 بسبب أن التركيز على ملاحظات المستخدمين قصيرة الأجل زاد من الاتجاهات المُدحِّة في مخرجاته. اضطرت الشركة فعليًا إلى التراجع عن تحسين لأن النموذج تعلم الدرس الخاطئ من تفاعله.
ما يعنيه ذلك لمستثمري العملات المشفرة والذكاء الاصطناعي
للمستثمرين الذين يقيمون مشاريع التقاطع بين الذكاء الاصطناعي والعملات المشفرة، يجب أن تصبح جودة بنية الذاكرة والضمانات ضد السلوك المُتملق أولويات في التدقيق اللازم. يجب على المشروع الذي يدعي أن وكيله الذكي يمكنه إدارة محفظة DeFi بشكل مستقل أن يُظهر كيفية تعامله مع تدهور السياق عبر آلاف التفاعلات، وليس فقط مدى كفاءته في عرض تجريبي واحد.
تتّبع تيتر حلولًا في هذا المجال، وفتحت مصدر تقنيتها TurboQuant الموجهة إلى تقليل كبير في الذاكرة في الأنظمة اللامركزية.
