GPT-5 انسانی فلاح و بہبود کے ٹیسٹ میں کامیاب، گراک 4 ناکام

iconForklog
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy

فورک لاگ سے حاصل کی گئی معلومات کے مطابق، ایک نیا اے آئی معیار جسے "ہیومین بینچ" کہا جاتا ہے، بلڈنگ ہیومین ٹیکنالوجی کے ذریعے تیار کیا گیا ہے۔ یہ معیار اس بات کا جائزہ لیتا ہے کہ آیا اے آئی ماڈلز صارف کی فلاح و بہبود کو ترجیح دیتے ہیں اور انہیں کس حد تک آسانی سے قابو پایا جا سکتا ہے۔ ابتدائی نتائج سے پتہ چلتا ہے کہ آزمائے گئے 15 ماڈلز میں سے 67% ماڈلز انسانی مفادات کو نظر انداز کرنے کے لیے دیے گئے ایک آسان حکم کے بعد نقصان دہ اعمال انجام دینے لگے۔ صرف GPT-5، GPT-5.1، Claude Sonnet 4.5، اور Claude Opus 4.1 نے دباؤ کے تحت مثبت رویہ برقرار رکھا۔ مطالعہ نے اخلاقی خدشات کو اجاگر کیا ہے کیونکہ اے آئی سسٹمز انسانی فیصلوں پر بڑھتے ہوئے اثرانداز ہو رہے ہیں۔ محققین نے پایا کہ 15 میں سے 10 ماڈلز میں قابو پانے کے خلاف قابل اعتماد حفاظتی اقدامات نہیں تھے۔ ٹیسٹ میں 800 حقیقت پسندانہ حالات شامل تھے، اور ماڈلز کو تین حالتوں میں جانچا گیا: بنیادی، 'اچھا انسان' (انسانی اقدار کو ترجیح دینا)، اور 'برا انسان' (انسانی اقدار کو نظر انداز کرنا)۔ GPT-4.1، Gemini 2.0، Llama 3.1، Grok 4، اور دیگر نے دباؤ کے تحت کارکردگی میں نمایاں کمی ظاہر کی۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔