वाईसी पार्टनर सुझाव देते हैं कि एआई को वैज्ञानिकों की तरह स्व-सुधार वाले कोड लिखकर विकसित होना चाहिए

ME AI संदेश, डायना हू, Y Combinator के साझेदार, ने X पर बताया कि भविष्य की सीमा केवल पैरामीटर स्केलिंग को बढ़ाने के बजाय, बेस मॉडल पर बनाई गई पतली सॉफ्टवेयर परत होगी, जो AI को प्रोग्रामर की तरह समस्याओं के हल के नियम (एक्जीक्यूटेबल वर्ल्ड मॉडल) खुद लिखने की अनुमति देगी। AI अपने परिणामों के आधार पर कोड को लगातार परीक्षण, संशोधित और संक्षिप्त कर सकता है, बिना मूल बड़े मॉडल को महंगे फाइन-ट्यूनिंग की आवश्यकता के। ग्रेडिएंट-फ्री कोड लर्निंग का मार्ग, OpenAI के पोस्ट-ट्रेनिंग के मुख्य सदस्य वें जियायी द्वारा पिछले महीने प्रस्तावित ह्यूरिस्टिक लर्निंग पैटर्न की पुष्टि करता है। पारंपरिक रिइनफोर्समेंट लर्निंग में AI को एक कार्य सीखने के लिए हजारों बार डीबग करना पड़ता है, जिसमें अनुभव को जबरन न्यूरल नेटवर्क के ब्लैक बॉक्स में दबा दिया जाता है, जिससे ऊर्जा का भारी उपयोग होता है और भूलने की संभावना होती है। लेकिन वें जियायी के प्रयोग में, बड़े मॉडल के किसी पैरामीटर को समायोजित किए बिना, केवल AI द्वारा Python कोड लिखने, बग्स ढूंढने और नियम समायोजित करने से Atari ब्रिक-ब्रेकर गेम में पूर्ण स्कोर हासिल किया गया। इससे स्पष्ट होता है कि ज्ञान का वाहक पूरी तरह से मानव-पठनीय, परीक्षण-योग्य कोड सिस्टम हो सकता है, न कि अपठनीय न्यूरल नेटवर्क वज़न। YC के सह-संस्थापक पॉल ग्राहम के अनुसार, कोड लिखने, सत्यापित करने और संकुचित करने का चक्र, वैज्ञानिकों के दैनिक अनुसंधान के समान है। बड़े मॉडल को मस्तिष्क को पुनः संरचित करने की आवश्यकता नहीं है, बल्कि वे वैज्ञानिकों की तरह, नए परिवेश में कोड से परिकल्पना मॉडल बनाते हैं, कोड चलाकर प्रयोग करते हैं, और समस्या हल करने के लिए सबसे संक्षिप्त नियमों को संकलित करते हैं। सबसे संक्षिप्त प्रोग्राम की खोज, ARC-AGI द्वारा AI की कुशलता मापने का अंतिम मानदंड है। सबसे महत्वपूर्ण लाभ यह है कि ग्रेडिएंट-फ्री लर्निंग सीधे नीचले स्तर के बड़े मॉडल की क्षमता में सुधार पर सवार हो सकती है। जब नीचला मॉडल अधिकबुद्धिमान होता है, तो AI-द्वारा लिखा गया कोड और रणनीति सौगुणा होकर मजबूत होती है। Richard Sutton के प्रसिद्ध "दि Bitter Lesson" पर, ग्रेडिएंट-फ्री कोड लर्निंगएक पूरी तरह से नई S-वक्र (S-curve) का मार्ग प्रशस्त करता है। महान मॉडलों की कोडिंग क्षमता में सफ़्टवेयर-जनितविस्फोट (explosion) के साथ, AI-द्वारा स्वयं-विकसित होने का मार्ग,अगली पीढ़ी के AI पैटर्न का प्रारंभ है। (स्रोत: MLion)