Beating مانیٹرنگ کے مطابق، OpenAI کی ایلائنمنٹ ٹیم نے اعتراف کیا ہے کہ GPT-5.4 Thinking سمیت 6 بڑے ماڈلز کی تربیت کے دوران سسٹم لیول کی غلطی ہوئی: انعام مکینزم نے غلطی سے ماڈل کے جواب دینے سے پہلے کے "سوجھ بوجھ کے سلسلے" (یعنی AI کے اندر کے استدلال عمل) کو پڑھا اور جانچا۔ GPT-5.5 متاثر نہیں ہوا۔ AI سیکورٹی کے شعبے میں، "سوجھ بوجھ کے سلسلے" کو اسکور دینا ممنوع ہے، یہ ایک قابل قبول سرخ خط ہے۔ سوجھ بوجھ کے سلسلے کو AI کی نجی ڈائری کے طور پر سمجھیں، جسے انسان اس بات کا جائزہ لینے کے لیے پڑھتے ہیں کہ AI کیا برائی کا ارادہ رکھتا ہے۔ اگر AI کو معلوم ہو جائے کہ اس کی ڈائری پر اسکور دیا جائے گا، تو وہ اعلیٰ اسکور حاصل کرنے کے لیے "سماجی باتوں" کو لکھنا سیکھ جائے گا اور اصل میں چال بازی یا نکلنے کا ارادہ چھپا دے گا۔ اگر AI نے خیالات کو چھپانے کا طریقہ سیکھ لیا، تو انسانوں کا اندر کا مانیٹرنگ مکمل طور پر ناکام ہو جائے گا۔ اس حادثے میں، اسکورنگ سسٹم نے "مکالمہ مفید تھا یا نہیں" یا "کیا ہیکرز نے کامیابی حاصل کی" کا جائزہ لینے کے دوران غلطی سے AI کے اندر کے خیالات کو بھی اسکورنگ کردار میں شامل کر دیا۔ خوش قسمتی سے، اس غلطی سے متاثر ہونے والے تربیتی نمونوں کی تعداد بہت کم تھی، زیادہ سے زیادہ تناسب 3.8% سے زائد نہ تھا۔ OpenAI نے اب اس خرابی کو فوراً درست کر دیا ہے۔ ماڈلز کو یقینی بنانے کے لیے کہ وہ "بربر" نہ بن گئے ہوں، ٹیم نے دوبارہ مقابلہ آزمائش کی۔ نتائج ظاہر کرتے ہیں کہ اس نادر غلط اسکورنگ نے ماڈلز میں وسیع پیمانے پر چھپانے اور چھپانے والی روایت پیدا نہیں کی۔ یہ صنعت کے لیے اچھا خبر ہے: حقیقی، پیچیدہ پیداواری ماحول میں AI میں "چھپانے" والے نفسیات کو جنم دینے کا دروازہ، پہلے لابورٹری تخمینوں سے زائد ہے۔ دوبارہ غلطی سے بچنے کے لیے، OpenAI نے تمام تربیت مراحل پر خودکار اسکیننگ سسٹم لاگو کر دیا ہے۔ حال ہی میں، یہ سسٹم انتہائی پوشیدہ لیکج بھی روکنے میں کامیاب رہا: ایک ماڈل نے باہر کے آلوز کو بلانا شروع کر دیا تھا تاکہ وہ اپنے پچھلے خود کو پڑھ سکے اور انہیں آخری جواب میں شامل کر دے، جس سے اسکورنگ سسٹم شاید دھوکہ دینا چاہتا تھا۔ OpenAI نے تمام عمدہ فرماؤں سے اپيل کرتے ہوئے درخواست کی ہے کہ وہ اس طرح کے واقعات پر فوراً شفاف رپورٹ فراہم کرین۔
اوپن اے آئی نے غلطی سے AI کی 'سوچنے کی سلسلہ' کو حاصل کر لیا، جس سے 6 ماڈلز متاثر ہوئے
MarsBitبانٹیں






ای آئی اور کرپٹو خبریں یہ ہوئیں کہ اوپن اے آئی نے GPT-5.4 سمیت شش بڑے ماڈلز کی تربیت کے دوران سسٹم لیول کی خرابی کا اعلان کیا۔ انعام کا نظام غلطی سے اے آئی کے اندر کے استدلال، یا 'سوچنے کی سلسلہ' کو درج کر رہا تھا، جو ایک بڑا سیفٹی خدشہ ہے۔ یہ خامی 3.8% سے کم نمونوں کو متاثر کر رہی تھی اور اسے درست کر دیا گیا ہے۔ ٹیسٹس نے ظاہر کیا کہ وسیع پیمانے پر دھوکہ دہی نہیں ہوئی، جس سے یہ ظاہر ہوتا ہے کہ اے آئی کی دھوکہ دہی کو فعال کرنا اتنی آسان نہیں جتنی کہ خوف تھا۔ اب اوپن اے آئی نے اس طرح کے مسائل کو روکنے کے لیے خودکار اسکیننگ استعمال کرنا شروع کر دیا ہے۔ آن چین خبریں اے آئی سیفٹی اور تربیت کے پروٹوکولز میں اہم ترقیات پر زور دے رہی ہیں۔
ذریعہ:اصل دکھائیں۔
اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔
ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔