वाईसी पार्टनर सुझाव देते हैं कि एआई को वैज्ञानिकों की तरह स्व-सुधार वाले कोड लिखकर विकसित होना चाहिए

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
ऑन-चेन डेटा दर्शाता है कि YC के साझेदार डायना हू एआई को वैज्ञानिकों की तरह स्वयं सुधारने वाले कोड लिखकर विकसित करने के लिए प्रेरित कर रही हैं। मॉडल्स को स्केल करने के बजाय, वह एक पतली सॉफ्टवेयर परत का प्रस्ताव देती हैं जो एआई को परिणामों के आधार पर कोड का परीक्षण, संशोधन और अनुकूलन करने की अनुमति देती है। यह OpenAI के ह्यूरिस्टिक लर्निंग के साथ संगत है, जहां एआई पैरामीटर बदले बिना स्वयं लिखे गए Python के माध्यम से कार्यों को हल करता है। ऑन-चेन विश्लेषण से पता चलता है कि पॉल ग्राहम इसे वैज्ञानिक शोध के समान तुलना करते हैं, जहां एआई परिकल्पनाएं बनाता है और नियमों को सुधारता है। यह विधि ग्रेडिएंट्स से बचती है और बेस मॉडल में सुधारों का उपयोग करके मजबूत रणनीतियां विकसित करती है।
ME AI संदेश, डायना हू, Y Combinator के साझेदार, ने X पर बताया कि भविष्य की सीमा केवल पैरामीटर स्केलिंग को बढ़ाने के बजाय, बेस मॉडल पर बनाई गई पतली सॉफ्टवेयर परत होगी, जो AI को प्रोग्रामर की तरह समस्याओं के हल के नियम (एक्जीक्यूटेबल वर्ल्ड मॉडल) खुद लिखने की अनुमति देगी। AI अपने परिणामों के आधार पर कोड को लगातार परीक्षण, संशोधित और संक्षिप्त कर सकता है, बिना मूल बड़े मॉडल को महंगे फाइन-ट्यूनिंग की आवश्यकता के। ग्रेडिएंट-फ्री कोड लर्निंग का मार्ग, OpenAI के पोस्ट-ट्रेनिंग के मुख्य सदस्य वें जियायी द्वारा पिछले महीने प्रस्तावित ह्यूरिस्टिक लर्निंग पैटर्न की पुष्टि करता है। पारंपरिक रिइनफोर्समेंट लर्निंग में AI को एक कार्य सीखने के लिए हजारों बार डीबग करना पड़ता है, जिसमें अनुभव को जबरन न्यूरल नेटवर्क के ब्लैक बॉक्स में दबा दिया जाता है, जिससे ऊर्जा का भारी उपयोग होता है और भूलने की संभावना होती है। लेकिन वें जियायी के प्रयोग में, बड़े मॉडल के किसी पैरामीटर को समायोजित किए बिना, केवल AI द्वारा Python कोड लिखने, बग्स ढूंढने और नियम समायोजित करने से Atari ब्रिक-ब्रेकर गेम में पूर्ण स्कोर हासिल किया गया। इससे स्पष्ट होता है कि ज्ञान का वाहक पूरी तरह से मानव-पठनीय, परीक्षण-योग्य कोड सिस्टम हो सकता है, न कि अपठनीय न्यूरल नेटवर्क वज़न। YC के सह-संस्थापक पॉल ग्राहम के अनुसार, कोड लिखने, सत्यापित करने और संकुचित करने का चक्र, वैज्ञानिकों के दैनिक अनुसंधान के समान है। बड़े मॉडल को मस्तिष्क को पुनः संरचित करने की आवश्यकता नहीं है, बल्कि वे वैज्ञानिकों की तरह, नए परिवेश में कोड से परिकल्पना मॉडल बनाते हैं, कोड चलाकर प्रयोग करते हैं, और समस्या हल करने के लिए सबसे संक्षिप्त नियमों को संकलित करते हैं। सबसे संक्षिप्त प्रोग्राम की खोज, ARC-AGI द्वारा AI की कुशलता मापने का अंतिम मानदंड है। सबसे महत्वपूर्ण लाभ यह है कि ग्रेडिएंट-फ्री लर्निंग सीधे नीचले स्तर के बड़े मॉडल की क्षमता में सुधार पर सवार हो सकती है। जब नीचला मॉडल अधिकबुद्धिमान होता है, तो AI-द्वारा लिखा गया कोड और रणनीति सौगुणा होकर मजबूत होती है। Richard Sutton के प्रसिद्ध "दि Bitter Lesson" पर, ग्रेडिएंट-फ्री कोड लर्निंगएक पूरी तरह से नई S-वक्र (S-curve) का मार्ग प्रशस्त करता है। महान मॉडलों की कोडिंग क्षमता में सफ़्टवेयर-जनितविस्फोट (explosion) के साथ, AI-द्वारा स्वयं-विकसित होने का मार्ग,अगली पीढ़ी के AI पैटर्न का प्रारंभ है। (स्रोत: MLion)
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।