GPT-5.4 मेमोरी कम्प्रेशन प्रयोग में सटीकता 54% तक गिर गई

icon MarsBit
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
मार्सबिट की हालिया एक अध्ययन ने दर्शाया है कि दोहराई गई मेमोरी संपीड़न एआई मॉडल के प्रदर्शन को कैसे नुकसान पहुंचा सकता है। इलिनोइस विश्वविद्यालय के डॉक्टरेट के छात्र डाइलन ज़ैंग ने पाया कि GPT-5.4 की ARC-AGI बेंचमार्क पर सटीकता कई चक्रों के संपीड़न के बाद 100% से घटकर 54% हो गई। समस्या इस बात से उत्पन्न होती है कि मॉडल सही समाधानों को सामान्य नियमों में बदल देते हैं, जिससे महत्वपूर्ण विवरण खो जाते हैं। WebShop कार्य में भी समान परिणाम दिखे, जहां अधिक विशेषज्ञ ट्रैजेक्टरीज़ ने प्रदर्शन को खराब किया। इन खोजों से सुझाव मिलता है कि कच्चे संचालन डेटा को बनाए रखा जाए और सारांशों को सीमित किया जाए। अल्टकॉइन्स को ट्रैक करने वाले ट्रेडर्स के लिए, एआई-संचालित उपकरणों का मूल्यांकन करने में ऑन-चेन डेटा लगातार अधिक उपयोगी होता जा रहा है।

Beating Monitoring के अनुसार, इलिनोइस विश्वविद्यालय के कंप्यूटर विज्ञान के डॉक्टरल छात्र डाइलन ज़हांग ने एजेंट स्मृति पर एक सेट प्रयोग किए, जिनके परिणाम एक असामान्य निष्कर्ष की ओर इशारा करते हैं: मॉडल को बार-बार अनुभव संक्षिप्त करने के लिए प्रेरित करने से उसकी स्मृति खराब हो सकती है। ARC-AGI से सबसे चौंकाने वाले परिणाम ये हैं: शोधकर्ताओं ने GPT-5.4 के बिना स्मृति के सभी 19 प्रश्नों को चुना, जिन्हें वे सही ढंग से हल कर सकते थे, और फिर इन प्रश्नों के वास्तविक हल मॉडल को प्रदान किए, ताकि वह देखते हुए "अनुभव संक्षिप्तीकरण" लिख सके। इसका मतलब है कि यह खुली पुस्तक की तरह पढ़ाई है; हालाँकि, कई पीढ़ियों के स्मृति संकुचन के बाद, समान मॉडल की सटीकता 100% से घटकर 54% हो गई। मूल पथ में कोई त्रुटि नहीं थी, समस्या वहाँ थी जहाँ मॉडल ने सही पथ को सामान्य अनुभव में पुनः लिखा। और यह स्मृति का ह्रास केवल एक मामला नहीं है। WebShop ऑनलाइन खरीदारी कार्य में, AWM स्मृति पद्धति 8 पेशेवर पथों के साथ 0.64 स्कोर प्राप्त करती है, लेकिन पथ 128 होने पर स्कोर 0.20 पर गिर जाता है, जो सटीकतः बिना स्मृति के मूलबिंदु पर पहुँचता है। मतलब, स्मृति जितनी अधिक संचित होती है, उतना ही लाभ स्वयं मिटा दिया जाता है। समस्या "अनुभव कम होने" में नहीं, "बहुत अधिक संक्षिप्तीकरण" में है। महान मॉडल द्वारा लिखा गया "अनुभव" कोई वस्तुनिष्ठ लॉग नहीं है; हर संक्षिप्तीकरण पुनः-उत्पन्न होता है। अंत में, विशिष्ट पूर्वशर्तें हटा दी जाती हैं, विभिन्न कार्यों के नियम मिला-जुला हो जाते हैं, और मूलतः क्रिया को मार्गदर्शन करने वाले विस्तार सुविधाएँ "सबसे सीधी क्रिया पर प्राथमिकता दें" या "सही उपकरण का प्रयोग करें" जैसे, प्रतीत होने में सही परंतु वास्तव में अप्रयोगी, सामान्य कथनों में परिणत हो जाते हैं। मूल पाठ में, 50 संरचित स्मृति कोएकल संकलन में मिला दिया गया, कई कार्यों के अंतर को समान सामान्य प्रक्रिया में समेटा, परिणामस्वरूप, परीक्षण में 6 से 13 सफल प्रतिदर्शों को हटा दिया। लेखकों का सुझाव काफी संयमित है: Agent को प्रत्येक पड़ाव पर "गलत प्रश्नों की पुस्तिका" लिखने के लिए प्रेरित मत करें।अधिक सुरक्षित पद्धति है—चयनित मूल क्रिया पथों को संरक्षित करें,और केवल सचमुचआवश्यकता होने पर ही सामान्यीकरण करें।प्रयोग में,मूल episode को संरक्षित करना,और सामान्यीकरण कोबंद करना,अनेक Agent मानकों परप्रयुक्त संपीड़ित-स्मृति पद्धति कोपीछा करता हैया पार करता है।विकासकर्ताओं के लिए,यह निष्कर्ष सीधा है:मॉडल कोवहीदिखाएँजोउसनेवास्तवमेंकिया,अक्सरउसेअमूर्तनियमोंकेबहुतसेसमूहयाददिलानेसेअधिकउपयोगीहोताहै।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।