GPT-5.4 মেমোরি কম্প্রেশন পরীক্ষায় সঠিকতা 54% এ নেমে যায়

icon MarsBit
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
মার্সবিট থেকে একটি সাম্প্রতিক অধ্যয়ন দেখিয়েছে যে পুনরাবৃত্ত মেমোরি কম্প্রেশন কিভাবে এআই মডেলের পারফরম্যান্সকে ক্ষতি করতে পারে। ইলিনয় বিশ্ববিদ্যালয়ের পিএইচডি শিক্ষার্থী ডাইলান জাং খুঁজে পেয়েছেন যে জি-পি-টি-৫.৪-এর এআরসি-এজিআই বেঞ্চমার্কে সঠিকতা ১০০% থেকে কমে পড়ে ৫৪%। সমস্যাটি মডেলগুলির সঠিক সমাধানগুলিকে সাধারণীকৃত নিয়মে পুনর্লিখন করার কারণে ঘটে, যার ফলে গুরুত্বপূর্ণ বিস্তারিতগুলি হারিয়ে যায়। ওয়েবশপ টাস্কেও একই ফলাফল দেখা গিয়েছে, যেখানে বেশি বিশেষজ্ঞ ট্রাজেক্টরির ফলে পারফরম্যান্স খারাপ হয়েছে। এই ফলাফলগুলির সুপারিশ করছে যে কাঁচা অপারেশন ডেটা বজায় রাখা এবং বিষয়বস্তুর সারসংক্ষেপকে সীমিত রাখা। অল্টকয়েনগুলির ট্র্যাকিংয়ের জন্য ট্রেডারদের জন্য, এআই-চালিত টুলগুলির মূল্যায়নের জন্য অন-চেইন ডেটা আরও বেশি উপযোগী হয়ে উঠছে।

Beating মনিটরিং অনুসারে, ইলিনয় বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের ডক্টরাল ছাত্র ডাইলান জাং একটি এজেন্ট মেমোরি পরীক্ষা পরিচালনা করেন, যার ফলাফল একটি অস্বাভাবিক উপসংহারের দিকে ইঙ্গিত করে: মডেলকে পুনরাবৃত্তি করে অভিজ্ঞতা সংক্ষেপ করতে বললে এটি আরও খারাপভাবে মনে রাখতে পারে। ARC-AGI-এর সবচেয়ে চোখে পড়া ফলাফলগুলির মধ্যে: গবেষকদের 19টি প্রশ্ন বাছাই করা হয়েছিল, যেগুলি GPT-5.4 মেমোরি ছাড়াই সম্পূর্ণভাবে সঠিকভাবে সমাধান করতে পারত, এবং এই প্রশ্নগুলির প্রকৃত সমাধানগুলি মডেলকে দেওয়া হয়েছিল, যাতে এটি "অভিজ্ঞতা সংক্ষেপ" লিখতে পারে। যুক্তি অনুযায়ী, এটি একটি "খোলা-বই" পরীক্ষা; কিন্তু একাধিক মেমোরি-সংকুচন চক্রের পর, একই মডেলের সঠিকতা 100% থেকে 54%-এ পড়েছিল। মূলট্র্যাজেক্টরির কোনও ভুল ছিল না, সমস্যা ছিল—মডেলটি সঠিকট্র্যাজেক্টরির সমন্বয়ে "সাধারণীকৃত" অভিজ্ঞতা"তে রূপান্তরিত করার ধাপটি। আরওখারাপ, এই "মেমোরি-ডিগ্রেডেশন"টি একটি বিশেষ ঘটনা নয়। WebShop-এরওয়েব-শপিংটাস্ক-এ, AWM-মেমোরি-মেথড 8টি "এক্সপার্ট-ট্র্যাজেক্টরি"এরজন্য 0.64স্কোরপেয়েছিল, 128টি "ট্র্যাজেক্টরি"-এরজন্য 0.20-এনেমান,যাঅবশ্যইমেমোরি-হীনবেসলাইন-এফিরিয়াল।অর্থাৎ,মেমোরি-বড়হওয়ায়,লাভওসমন্বয়হয়েযায়। সমস্যা "অভিজ্ঞতা-খুবকম"এনয়, "সংক্ষেপণ-খুববেশি"এ।বড়মডেলগুলিরদ্বারালিখিতঅভিজ্ঞতা"হল"বস্তুনিষ্ঠলগ"নয়;প্রতিবারসংক্ষেপণহলএকটিনতুনজেনারেশন।শেষপর্যন্ত,বিশদপূর্বশর্তগুলিকেবাদদিয়েফেলাহয়,বিভিন্নটাস্কগুলিরনিয়মগুলিকেএকসঙ্গেমিশিয়েদেওয়াহয়,এবংঅপারেশনগুলিকেনির্দেশদিতপারা"বিশদ"গুলিকে"সবচেয়েসরলকরণগুলিকেঅগ্রাধিকারদিন""সঠিকটুলব্যবহারকরুন"এইভাবেদৃষ্টি-আকর্ষণকারী,কিন্তুবাস্তবসহযোগিতা-হীন"অসৎ"উক্তি-এপরিণতকরাহয়।পাঠটিরএকটিঅতি-চরমউদাহরণহল:50টি"স্ট্রাকচারডমেমোরি"একবারএকটি"জেনারিকপ্রসেস"-এসমন্বয়হয়,অনেকগুলি"টাস্ক"-এরপার্থক্যগুলিকেএকইপথ-এআবদ্ধহয়,এবংপরবর্তীপরীক্ষণগুলিত6থেকে13টিসফলসমপথগুলিকেখসিয়াপড়াহয়। লেখকদেরপরামর্শখুবসতর্ক:এজেন্টদেরপ্রতিটি"চক্র"-এ"ভুল-বই"-এখতমতদিতনয়।আরওসহজভাবে,ছটা"অপশন"-এখতমতদিন:অভিজ্ঞতা-পথগুলি(episode)থেকেঅভিজ্ঞতা-সংক্ষেপণ(abstractsummary)অপসারণ;এইপদ্ধতি,অনেকAgent-বেঞ্চমার্ক-এআধুনিকসংকুচন-ভিত্তিকমেমোরি-পদ্ধতি-এখতমতদওয়াহয়।ডভলপারদেরজনয,এইউপসংহারখুবসহজ:মডেলকेअসলঅপারশনগুলি(realactions)দেখান,অধিকভাবইউহউপদশগুলি(abstractrules)শখতমতদওয়াহয়।

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।