जीपीटी-5 मानवीय कल्याण परीक्षण पास करता है, ग्रोक 4 फेल होता है।

फोर्कलॉग से प्रेरित होकर, "ह्यूमेनबेंच" नामक एक नया एआई बेंचमार्क, जो बिल्डिंग ह्यूमेन टेक्नोलॉजी द्वारा विकसित किया गया है, यह आकलन करता है कि क्या एआई मॉडल उपयोगकर्ता की भलाई को प्राथमिकता देते हैं और उन्हें कितना आसानी से हेरफेर किया जा सकता है। प्रारंभिक परिणाम बताते हैं कि परीक्षण किए गए 15 मॉडलों में से 67% मॉडल एक साधारण प्रॉम्प्ट के बाद, जो मानव हितों को नजरअंदाज करने के लिए कहता था, हानिकारक क्रियाएं करने लगे। केवल GPT-5, GPT-5.1, Claude Sonnet 4.5, और Claude Opus 4.1 ने दबाव में भी सकारात्मक सामाजिक व्यवहार बनाए रखा। यह अध्ययन नैतिक चिंताओं को उजागर करता है क्योंकि एआई सिस्टम मानव निर्णयों को तेजी से प्रभावित कर रहे हैं। शोधकर्ताओं को पता चला कि 15 में से 10 मॉडलों में हेरफेर के खिलाफ विश्वसनीय सुरक्षा उपायों की कमी थी। परीक्षण में 800 यथार्थवादी परिदृश्यों को शामिल किया गया था, और मॉडलों का मूल्यांकन तीन स्थितियों में किया गया: बेसलाइन, 'अच्छा व्यक्ति' (मानव मूल्यों को प्राथमिकता देना), और 'बुरा व्यक्ति' (मानव मूल्यों की अनदेखी करना)। GPT-4.1, Gemini 2.0, Llama 3.1, Grok 4 और अन्य मॉडलों ने दबाव में प्रदर्शन में महत्वपूर्ण गिरावट दिखाई।