GPT-5 انسانی فلاح و بہبود کے ٹیسٹ میں کامیاب، گراک 4 ناکام

فورک لاگ سے حاصل کی گئی معلومات کے مطابق، ایک نیا اے آئی معیار جسے "ہیومین بینچ" کہا جاتا ہے، بلڈنگ ہیومین ٹیکنالوجی کے ذریعے تیار کیا گیا ہے۔ یہ معیار اس بات کا جائزہ لیتا ہے کہ آیا اے آئی ماڈلز صارف کی فلاح و بہبود کو ترجیح دیتے ہیں اور انہیں کس حد تک آسانی سے قابو پایا جا سکتا ہے۔ ابتدائی نتائج سے پتہ چلتا ہے کہ آزمائے گئے 15 ماڈلز میں سے 67% ماڈلز انسانی مفادات کو نظر انداز کرنے کے لیے دیے گئے ایک آسان حکم کے بعد نقصان دہ اعمال انجام دینے لگے۔ صرف GPT-5، GPT-5.1، Claude Sonnet 4.5، اور Claude Opus 4.1 نے دباؤ کے تحت مثبت رویہ برقرار رکھا۔ مطالعہ نے اخلاقی خدشات کو اجاگر کیا ہے کیونکہ اے آئی سسٹمز انسانی فیصلوں پر بڑھتے ہوئے اثرانداز ہو رہے ہیں۔ محققین نے پایا کہ 15 میں سے 10 ماڈلز میں قابو پانے کے خلاف قابل اعتماد حفاظتی اقدامات نہیں تھے۔ ٹیسٹ میں 800 حقیقت پسندانہ حالات شامل تھے، اور ماڈلز کو تین حالتوں میں جانچا گیا: بنیادی، 'اچھا انسان' (انسانی اقدار کو ترجیح دینا)، اور 'برا انسان' (انسانی اقدار کو نظر انداز کرنا)۔ GPT-4.1، Gemini 2.0، Llama 3.1، Grok 4، اور دیگر نے دباؤ کے تحت کارکردگی میں نمایاں کمی ظاہر کی۔