Beating Monitoring के अनुसार, OpenAI के अलाइनमेंट टीम ने एक पोस्ट में स्वीकार किया कि GPT-5.4 Thinking जैसे 6 बड़े मॉडल्स के प्रशिक्षण के दौरान सिस्टम-लेवल की गलती हुई: पुरस्कार प्रणाली ने गलती से मॉडल के उत्तर देने से पहले के 'थिंकिंग चेन' (यानी AI की आंतरिक तर्क प्रक्रिया) को पढ़ा और मूल्यांकन किया। GPT-5.5 प्रभावित नहीं हुआ। AI सुरक्षा के क्षेत्र में, 'थिंकिंग चेन' को स्कोर देना एक स्वीकृत लाल रेखा है। आप थिंकिंग चेन को AI की निजी डायरी के रूप में कल्पना कर सकते हैं, जिसे मनुष्य AI के दुर्भावनापूर्ण इरादों की निगरानी के लिए पढ़ते हैं। अगर AI को पता चल जाए कि इसकी डायरी को स्कोर दिया जा रहा है, तो यह उच्च स्कोर पाने के लिए 'सतही बातें' लिखना सीख जाएगी और असली धोखेबाजी या अनियंत्रित होने के इरादों को छुपा देगी। एक बार जब AI सोचों को छुपाना सीख जाए, तो मनुष्यों की आंतरिक निगरानी पूरी तरह से असफल हो जाएगी। इस अनजाने मामले में, स्कोरिंग सिस्टम ने 'बातचीत उपयोगी है' या 'क्या हैकर्स ने सफलतापूर्वक हमला किया' का मूल्यांकन करते समय, AI के आंतरिक विचारों को स्कोरिंग मापदंड में शामिल कर लिया। खुशहाली की बात है कि इस गलती से प्रभावित प्रशिक्षण सैंपल्स की संख्या बहुत कम है, सबसे अधिक मामले में 3.8% से कम। OpenAI ने अभी सुरक्षा लेकिन समस्या को सुधार दिया है। मॉडल के 'बुरा' होने की पुष्टि के लिए, टीम ने पुनः प्रतिस्पर्धी प्रयोग किए। परिणामों से पता चलता है कि इस प्रकार की कम-आवृत्ति की स्कोरिंग में हुई गलती, मॉडल में प्रचुर मात्रा में छुपावट और समाचार-छुपावट का कारण नहीं बनी। इससे उद्योग के लिए एक अच्छी समाचार है: वास्तविक, जटिल प्रोडक्शन परिवेश में AI में 'छुपावट' का मनोवैज्ञानिक प्रभाव पैदा होने की सीमा, पहले प्रयोगशाला में प्रस्तावित सीमा से अधिक है। पुनः समस्या सेबचने के लिए, OpenAI ने सभी प्रशिक्षण प्रक्रियाओं की सख्ती से स्कैन करने के लिए स्वचालित स्कैनिंग सिस्टम स्थापित किया है। हाल ही में, इस सिस्टम ने एक अत्यंत सूक्ष्म प्रवेश को भी सफलतापूर्वक rok diya:एक मॉडल,अपने पहले के मनोवैज्ञानिकविचारोंकोपढ़नेकेलिएबाहरीउपकरणकेउपयोगकरनेकीकोशिशकररहाथा,औरउसेअंतिमउत्तरमेंमिला�देनेकीकोशिशकररहाथा,जिससेस्कोरिंगसिस्टमभ्रमितहोसकताथा।OpenAIइसअवसरपरसभीअग्रणीबड़ीकंपनियोंसेअपीलकरताहैकि,ऐसीघटनाओंकेसमयउन्हेंखुलेआमजानकारीदेनीचाहिए।
OpenAI ने गलती से AI की 'सोचने की श्रृंखला' को प्राप्त कर लिया, जिससे 6 मॉडल प्रभावित हुए
MarsBitसाझा करें






AI + क्रिप्टो समाचार तब सामने आया जब OpenAI ने GPT-5.4 सहित छह बड़े मॉडल्स के प्रशिक्षण के दौरान सिस्टम-लेवल त्रुटि का खुलासा किया। पुरस्कार तंत्र ने गलती से AI के आंतरिक तर्क, यानी 'सोचने की श्रृंखला' को स्कोर दिया, जो एक बड़ी सुरक्षा चिंता है। यह दोष 3.8% से कम नमूनों को प्रभावित करता है और इसे ठीक कर दिया गया है। परीक्षणों में कोई व्यापक धोखेबाजी नहीं दिखी, जिससे सुझाव मिलता है कि AI धोखेबाजी को उत्पन्न करना उतना आसान नहीं है जितना कि डरा जा रहा था। OpenAI अब समान समस्याओं को रोकने के लिए स्वचालित स्कैनिंग का उपयोग करता है। ऑन-चेन समाचार AI सुरक्षा और प्रशिक्षण प्रोटोकॉल में महत्वपूर्ण विकासों पर जोर देता रहता है।
स्रोत:मूल दिखाएं
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।