Beating Monitoring के अनुसार, इलिनोइस विश्वविद्यालय के कंप्यूटर विज्ञान के डॉक्टरल छात्र डाइलन ज़हांग ने एजेंट स्मृति पर एक सेट प्रयोग किए, जिनके परिणाम एक असामान्य निष्कर्ष की ओर इशारा करते हैं: मॉडल को बार-बार अनुभव संक्षिप्त करने के लिए प्रेरित करने से उसकी स्मृति खराब हो सकती है। ARC-AGI से सबसे चौंकाने वाले परिणाम ये हैं: शोधकर्ताओं ने GPT-5.4 के बिना स्मृति के सभी 19 प्रश्नों को चुना, जिन्हें वे सही ढंग से हल कर सकते थे, और फिर इन प्रश्नों के वास्तविक हल मॉडल को प्रदान किए, ताकि वह देखते हुए "अनुभव संक्षिप्तीकरण" लिख सके। इसका मतलब है कि यह खुली पुस्तक की तरह पढ़ाई है; हालाँकि, कई पीढ़ियों के स्मृति संकुचन के बाद, समान मॉडल की सटीकता 100% से घटकर 54% हो गई। मूल पथ में कोई त्रुटि नहीं थी, समस्या वहाँ थी जहाँ मॉडल ने सही पथ को सामान्य अनुभव में पुनः लिखा। और यह स्मृति का ह्रास केवल एक मामला नहीं है। WebShop ऑनलाइन खरीदारी कार्य में, AWM स्मृति पद्धति 8 पेशेवर पथों के साथ 0.64 स्कोर प्राप्त करती है, लेकिन पथ 128 होने पर स्कोर 0.20 पर गिर जाता है, जो सटीकतः बिना स्मृति के मूलबिंदु पर पहुँचता है। मतलब, स्मृति जितनी अधिक संचित होती है, उतना ही लाभ स्वयं मिटा दिया जाता है। समस्या "अनुभव कम होने" में नहीं, "बहुत अधिक संक्षिप्तीकरण" में है। महान मॉडल द्वारा लिखा गया "अनुभव" कोई वस्तुनिष्ठ लॉग नहीं है; हर संक्षिप्तीकरण पुनः-उत्पन्न होता है। अंत में, विशिष्ट पूर्वशर्तें हटा दी जाती हैं, विभिन्न कार्यों के नियम मिला-जुला हो जाते हैं, और मूलतः क्रिया को मार्गदर्शन करने वाले विस्तार सुविधाएँ "सबसे सीधी क्रिया पर प्राथमिकता दें" या "सही उपकरण का प्रयोग करें" जैसे, प्रतीत होने में सही परंतु वास्तव में अप्रयोगी, सामान्य कथनों में परिणत हो जाते हैं। मूल पाठ में, 50 संरचित स्मृति कोएकल संकलन में मिला दिया गया, कई कार्यों के अंतर को समान सामान्य प्रक्रिया में समेटा, परिणामस्वरूप, परीक्षण में 6 से 13 सफल प्रतिदर्शों को हटा दिया। लेखकों का सुझाव काफी संयमित है: Agent को प्रत्येक पड़ाव पर "गलत प्रश्नों की पुस्तिका" लिखने के लिए प्रेरित मत करें।अधिक सुरक्षित पद्धति है—चयनित मूल क्रिया पथों को संरक्षित करें,और केवल सचमुचआवश्यकता होने पर ही सामान्यीकरण करें।प्रयोग में,मूल episode को संरक्षित करना,और सामान्यीकरण कोबंद करना,अनेक Agent मानकों परप्रयुक्त संपीड़ित-स्मृति पद्धति कोपीछा करता हैया पार करता है।विकासकर्ताओं के लिए,यह निष्कर्ष सीधा है:मॉडल कोवहीदिखाएँजोउसनेवास्तवमेंकिया,अक्सरउसेअमूर्तनियमोंकेबहुतसेसमूहयाददिलानेसेअधिकउपयोगीहोताहै।
GPT-5.4 मेमोरी कम्प्रेशन प्रयोग में सटीकता 54% तक गिर गई
MarsBitसाझा करें






मार्सबिट की हालिया एक अध्ययन ने दर्शाया है कि दोहराई गई मेमोरी संपीड़न एआई मॉडल के प्रदर्शन को कैसे नुकसान पहुंचा सकता है। इलिनोइस विश्वविद्यालय के डॉक्टरेट के छात्र डाइलन ज़ैंग ने पाया कि GPT-5.4 की ARC-AGI बेंचमार्क पर सटीकता कई चक्रों के संपीड़न के बाद 100% से घटकर 54% हो गई। समस्या इस बात से उत्पन्न होती है कि मॉडल सही समाधानों को सामान्य नियमों में बदल देते हैं, जिससे महत्वपूर्ण विवरण खो जाते हैं। WebShop कार्य में भी समान परिणाम दिखे, जहां अधिक विशेषज्ञ ट्रैजेक्टरीज़ ने प्रदर्शन को खराब किया। इन खोजों से सुझाव मिलता है कि कच्चे संचालन डेटा को बनाए रखा जाए और सारांशों को सीमित किया जाए। अल्टकॉइन्स को ट्रैक करने वाले ट्रेडर्स के लिए, एआई-संचालित उपकरणों का मूल्यांकन करने में ऑन-चेन डेटा लगातार अधिक उपयोगी होता जा रहा है।
स्रोत:मूल दिखाएं
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।