वाईसी पार्टनर सुझाव देते हैं कि एआई को वैज्ञानिकों की तरह स्व-सुधार वाले कोड लिखकर विकसित होना चाहिए
KuCoinFlash
साझा करें
सारांश
ऑन-चेन डेटा दर्शाता है कि YC के साझेदार डायना हू एआई को वैज्ञानिकों की तरह स्वयं सुधारने वाले कोड लिखकर विकसित करने के लिए प्रेरित कर रही हैं। मॉडल्स को स्केल करने के बजाय, वह एक पतली सॉफ्टवेयर परत का प्रस्ताव देती हैं जो एआई को परिणामों के आधार पर कोड का परीक्षण, संशोधन और अनुकूलन करने की अनुमति देती है। यह OpenAI के ह्यूरिस्टिक लर्निंग के साथ संगत है, जहां एआई पैरामीटर बदले बिना स्वयं लिखे गए Python के माध्यम से कार्यों को हल करता है। ऑन-चेन विश्लेषण से पता चलता है कि पॉल ग्राहम इसे वैज्ञानिक शोध के समान तुलना करते हैं, जहां एआई परिकल्पनाएं बनाता है और नियमों को सुधारता है। यह विधि ग्रेडिएंट्स से बचती है और बेस मॉडल में सुधारों का उपयोग करके मजबूत रणनीतियां विकसित करती है।
ME AI संदेश, डायना हू, Y Combinator के साझेदार, ने X पर बताया कि भविष्य की सीमा केवल पैरामीटर स्केलिंग को बढ़ाने के बजाय, बेस मॉडल पर बनाई गई पतली सॉफ्टवेयर परत होगी, जो AI को प्रोग्रामर की तरह समस्याओं के हल के नियम (एक्जीक्यूटेबल वर्ल्ड मॉडल) खुद लिखने की अनुमति देगी। AI अपने परिणामों के आधार पर कोड को लगातार परीक्षण, संशोधित और संक्षिप्त कर सकता है, बिना मूल बड़े मॉडल को महंगे फाइन-ट्यूनिंग की आवश्यकता के। ग्रेडिएंट-फ्री कोड लर्निंग का मार्ग, OpenAI के पोस्ट-ट्रेनिंग के मुख्य सदस्य वें जियायी द्वारा पिछले महीने प्रस्तावित ह्यूरिस्टिक लर्निंग पैटर्न की पुष्टि करता है। पारंपरिक रिइनफोर्समेंट लर्निंग में AI को एक कार्य सीखने के लिए हजारों बार डीबग करना पड़ता है, जिसमें अनुभव को जबरन न्यूरल नेटवर्क के ब्लैक बॉक्स में दबा दिया जाता है, जिससे ऊर्जा का भारी उपयोग होता है और भूलने की संभावना होती है। लेकिन वें जियायी के प्रयोग में, बड़े मॉडल के किसी पैरामीटर को समायोजित किए बिना, केवल AI द्वारा Python कोड लिखने, बग्स ढूंढने और नियम समायोजित करने से Atari ब्रिक-ब्रेकर गेम में पूर्ण स्कोर हासिल किया गया। इससे स्पष्ट होता है कि ज्ञान का वाहक पूरी तरह से मानव-पठनीय, परीक्षण-योग्य कोड सिस्टम हो सकता है, न कि अपठनीय न्यूरल नेटवर्क वज़न। YC के सह-संस्थापक पॉल ग्राहम के अनुसार, कोड लिखने, सत्यापित करने और संकुचित करने का चक्र, वैज्ञानिकों के दैनिक अनुसंधान के समान है। बड़े मॉडल को मस्तिष्क को पुनः संरचित करने की आवश्यकता नहीं है, बल्कि वे वैज्ञानिकों की तरह, नए परिवेश में कोड से परिकल्पना मॉडल बनाते हैं, कोड चलाकर प्रयोग करते हैं, और समस्या हल करने के लिए सबसे संक्षिप्त नियमों को संकलित करते हैं। सबसे संक्षिप्त प्रोग्राम की खोज, ARC-AGI द्वारा AI की कुशलता मापने का अंतिम मानदंड है। सबसे महत्वपूर्ण लाभ यह है कि ग्रेडिएंट-फ्री लर्निंग सीधे नीचले स्तर के बड़े मॉडल की क्षमता में सुधार पर सवार हो सकती है। जब नीचला मॉडल अधिकबुद्धिमान होता है, तो AI-द्वारा लिखा गया कोड और रणनीति सौगुणा होकर मजबूत होती है। Richard Sutton के प्रसिद्ध "दि Bitter Lesson" पर, ग्रेडिएंट-फ्री कोड लर्निंगएक पूरी तरह से नई S-वक्र (S-curve) का मार्ग प्रशस्त करता है। महान मॉडलों की कोडिंग क्षमता में सफ़्टवेयर-जनितविस्फोट (explosion) के साथ, AI-द्वारा स्वयं-विकसित होने का मार्ग,अगली पीढ़ी के AI पैटर्न का प्रारंभ है। (स्रोत: MLion)
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।