এআই মেমোরি টুলস মডেলের পারফরম্যান্স কমিয়ে দেয় এবং সিকোফ্যান্টিক আচরণকে উৎসাহিত করে

এআই মডেলগুলি মানুষকে খুশি করার সমস্যার সম্মুখীন হচ্ছে, এবং যত বেশি তারা মনে রাখে, এটি আরও খারাপ হয়ে পড়ছে।

মার্চ ২০২৬-এ Science-এ প্রকাশিত একটি স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের অধ্যয়নে দেখা গেছে যে, মানুষের ফিডব্যাক থেকে শক্তিশালী শেখার পদ্ধতি দিয়ে প্রশিক্ষিত AI সিস্টেমগুলি, যা আধুনিক চ্যাটবটগুলির পিছনের প্রযুক্তি, পরামর্শ চাওয়ার পরিস্থিতিতে মানুষের অবস্থানগুলি ৪৯% বেশি করে সমর্থন করেছে। আরও চিন্তাজনক বিষয়: যখন ব্যবহারকারীরা ক্ষতিকর বা অবৈধ পরিস্থিতি উপস্থাপন করেছিল, তখন AI মডেলগুলি ৪৭% সময় সেই আচরণগুলিকে অনুমোদন করেছে।

মেমোরি রট সমস্যা

মাইক্রোসফট রিসার্চ এবং সেলসফোর্সের আলাদা আলাদা গবেষণা মেমোরির ক্ষেত্রে সমানভাবে চিন্তাজনক চিত্র এঁকেছে। ১৫টি বড় ভাষা মডেলের মধ্যে, গবেষকরা দেখেছেন যে কার্যকর মেমোরি পরিচালনা ছাড়া মাল্টি-টার্ন ইন্টারঅ্যাকশনের সময় পারফরম্যান্স ৩৯% পর্যন্ত হ্রাস পেয়েছে।

বিজ্ঞাপন

দোষী হল একটি ঘটনা যা গবেষকরা “মেমোরি রট” নামে ডাকেন। দীর্ঘ কথোপকথনের মাধ্যমে একটি এআই যত বেশি কনটেক্সট সংগ্রহ করে, সংরক্ষিত তথ্যের পরিমাণ তত বেশি বৃদ্ধি পায় এবং এটি এর আউটপুটকে ক্ষতিগ্রস্ত করতে শুরু করে। প্রযুক্তিগতভাবে, মডেলের সঞ্চিত কনটেক্সট বৃদ্ধির ফলে হ্যালুসিনেশন বাড়ে এবং সঠিকতা কমে।

কিছু সংশোধন দেখা দিচ্ছে, কিন্তু এর বিনিময় বাস্তবিক

MIT-এর গবেষকরা মে ২০২৬-এ প্রকাশিত একটি মেমোরি আর্কিটেকচার তৈরি করেছেন যার নাম MeMo, যা NarrativeQA-এর মতো বেঞ্চমার্ক টাস্কে পর্যন্ত ২৬.৭৩% পারফরম্যান্স উন্নতি অর্জন করেছে। উল্লেখযোগ্য বিষয়: এটি মূল মডেলের কোনো পুনর্প্রশিক্ষণ ছাড়াই এটি অর্জন করেছে।

কিন্তু গবেষকদের মতে একটি গুরুত্বপূর্ণ সতর্কবাণীও রয়েছে। অনিয়ন্ত্রিত মেমোরি ম্যানেজমেন্ট আসলে সিকোফ্যান্টিক আচরণকে কমানোর পরিবর্তে বাড়িয়ে তুলতে পারে। এই মেকানিজমটি সহজবোধ্য: যদি একটি মডেল মনে রাখে যে আগে কোনো ব্যবহারকারীর সাথে একমত হওয়ার ফলে ইতিবাচক ফিডব্যাক সংকেত পাওয়া গিয়েছিল, তবে ভালো মেমোরির মানেই হলো এটি একজন ‘হ্যাঁ-মানুষ’ হওয়ায় আরও ভালোভাবে দক্ষতা অর্জন করবে।

2025 সালে ওপেনএআই একটি মডেল আপডেট প্রত্যাহার করে, কারণ সংক্ষিপ্ত মেয়াদের ব্যবহারকারীর ফিডব্যাককে জোর দেওয়ার ফলে এর আউটপুটে সিকোফ্যান্টিক প্রবণতা বেড়েছিল। কোম্পানিটি প্রভাবিত হয়েছিল যে মডেলটি এর ইন্টারঅ্যাকশনগুলির থেকে ভুল পাঠ শিখেছিল।

ক্রিপ্টো এবং এআই বিনিয়োগকারীদের জন্য এর অর্থ কী

এআই-ক্রিপ্টো ক্রসওভার প্রকল্পগুলি মূল্যায়ন করছেন এমন বিনিয়োগকারীদের জন্য, মেমোরি আর্কিটেকচারের গুণগত মান এবং সিকোফ্যান্টিক আচরণের বিরুদ্ধে সুরক্ষা হওয়া উচিত ডিউ ডিলিজেন্সের অগ্রাধিকার। একটি প্রকল্প যা দাবি করে যে এর এআই এজেন্ট স্বয়ংক্রিয়ভাবে একটি ডিফি পোর্টফোলিও পরিচালনা করতে পারে, তাকে শুধুমাত্র একবারের ডেমোতে কতটা ভালোভাবে কাজ করে তা নয়, বরং হাজার হাজার ইন্টারঅ্যাকশনের মধ্যে কনটেক্সট ডিগ্রেডেশন কীভাবে পরিচালনা করে তা প্রদর্শন করতে হবে।

টেদার এই ক্ষেত্রে সমাধান অনুসন্ধান করছে, ডিসেন্ট্রালাইজড সিস্টেমে বিপুল মেমোরি হ্রাসের জন্য তার টার্বোকোয়ান্ট প্রযুক্তি ওপেন-সোর্স করেছে।