मेटा शोधकर्ता सारांश पुनः उपयोग के माध्यम से कोडिंग एजेंट्स में सुधार करते हैं

यह एक समस्या है जिससे कोई भी व्यक्ति जिसने कभी कोड का डीबग किया हो, वह सहमत होगा: आप कुछ करने की कोशिश करते हैं, यह विफल हो जाता है, आप फिर से कोशिश करते हैं, यह अलग तरह से विफल हो जाता है, और सातवें प्रयास तक आप भूल चुके होते हैं कि आपने पहले क्या अस्वीकार कर दिया था। अब कल्पना कीजिए कि यह चक्र एक AI एजेंट के अंदर चल रहा है, लेकिन भूलने के बजाय, एजेंट हर पिछले प्रयास से हजारों टोकन के विस्तृत कार्यान्वयन लॉग में डूब रहा है।

मेटा शोधकर्ताओं ने एक आश्चर्यजनक रूप से सरल समाधान खोजा। वे ने दिखाया कि कोडिंग एजेंट्स को उनकी पूर्ण कच्ची इतिहास नहीं, बल्कि पिछले प्रयासों के संक्षिप्त, संरचित सारांश प्रदान करने से भविष्य के प्रयासों को बहुत अधिक प्रभावी ढंग से मार्गदर्शन मिल सकता है।

कम अक्षर वास्तव में अधिक है

मूल निष्कर्ष लगभग विपरीत है, जबकि आजकल “अधिक डेटा” सामान्य उत्तर है। एक कोडिंग एजेंट द्वारा प्रयास किए गए और उसकी विफलता का संक्षिप्त दो-पंक्ति सारांश, एजेंट के अगले कदम को निर्देशित करने में हजारों टोकन के कच्चे निष्पादन लॉग से बेहतर प्रदर्शन कर सकता है।

यह तंत्र दो दिशाओं में काम करता है। पहले, यह संदर्भ शोर को कम करता है, जो सिग्नल-टू-नॉइज अनुपात के क्षय के एआई समकक्ष है। जब एजेंट की संदर्भ खिड़की लंबे, दोहराए गए लॉग डेटा से भर जाती है, तो उपयोगी जानकारी दब जाती है। सारांशीकरण के माध्यम से संपीड़न शोर को हटा देता है और वास्तव में महत्वपूर्ण जानकारी को बरकरार रखता है।

दूसरा, और शायद अधिक महत्वपूर्ण, यह विफलता की दोहराव को रोकता है। बिना इसके कि क्या गलत हुआ, उसका स्पष्ट रिकॉर्ड हो, एजेंट्स बार-बार एक ही गलतियाँ करते रहते हैं। एक संरचित सारांश “इसे फिर से मत करो” की एक चेकलिस्ट की तरह काम करता है, जो आवर्ती समस्या-समाधान के लिए अत्यंत मूल्यवान साबित होता है।

यह दृष्टिकोण अनुसंधानकर्ताओं के एजेंट सुधार के बारे में सोचने के तरीके में एक दार्शनिक बदलाव को दर्शाता है। पुनः प्रयासों की संख्या बढ़ाने या समस्या पर अधिक कंप्यूटिंग शक्ति लगाने के बजाय, ध्यान मेमोरी संपीड़न और अनुभव के पुनः उपयोग पर स्थानांतरित हो जाता है।

मेटा के व्यापक एजेंट शोध में यह कहाँ फिट बैठता है

यह कार्य एक खाली स्थान में नहीं है। यह मेटा के स्वयं-सुधार एजेंट सिस्टम में लगातार किए जा रहे प्रयास का हिस्सा है, जिसने 2026 की शुरुआत में हाइपरएजेंट्स और मेटा-हार्नेस जैसे ढांचे तैयार किए हैं।

उन पहले के ढांचों ने स्वायत्त AI प्रणालियों के लिए आधार तैयार किया, जो समय के साथ अपनी संचालन तर्क को सुधार सकती हैं। उनका सामना करना पड़ने वाला चुनौती ज्ञानात्मक भार था, विशेष रूप से, अनुभव जमा करने के साथ-साथ एजेंट्स को अपने ऐतिहासिक डेटा से भारी महसूस होने से कैसे बचाया जाए।

सारांशीकरण दृष्टिकोण सीधे उस बंद बिंदु को संबोधित करता है। एजेंट अभी भी अनुभव एकत्र करता है, लेकिन अब वह उस अनुभव को कुछ संक्षिप्त और कार्यात्मक चीज़ में प्रसंस्कृत करता है, जिसे भविष्य के निर्णय-निर्माण में वापस प्रयोग किया जाता है।

इसका निवेशकों और एआई दृश्य के लिए क्या अर्थ है

अभी, अधिकांश कोडिंग एजेंट कंपनियाँ अपने उत्पादों को बढ़ाकर सुधारती हैं। अधिक कंप्यूट, अधिक पुनः प्रयास, लंबे संदर्भ खिड़कियाँ। इन सबकी कीमत होती है। यदि मेटा का दृष्टिकोण अधिक व्यापक अनुप्रयोगों में सफल रहता है, तो यह बेहतर प्रदर्शन का एक ऐसा मार्ग सुझाता है जिसमें रैखिक रूप से लागत बढ़ाने की आवश्यकता नहीं होती।

जैसा कि हमेशा शोध पत्रों के साथ होता है, जोखिम यह है कि नियंत्रित परिणाम हमेशा उत्पादन वातावरण में अनुवादित नहीं होते। कोडिंग बेंचमार्क वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग से अधिक सुव्यवस्थित होते हैं, और उन दो पंक्तियों के सारांश की गुणवत्ता बहुत महत्वपूर्ण होती है। एक खराब सारांश पूरी तरह से कोई सारांश न होने की तुलना में बदतर हो सकता है, जो सहायक संकेतों के बजाय भ्रमित करने वाले संकेत पेश करता है।