اوپن اے آئی نے غلطی سے AI کی 'سوچنے کی سلسلہ' کو حاصل کر لیا، جس سے 6 ماڈلز متاثر ہوئے

Beating مانیٹرنگ کے مطابق، OpenAI کی ایلائنمنٹ ٹیم نے اعتراف کیا ہے کہ GPT-5.4 Thinking سمیت 6 بڑے ماڈلز کی تربیت کے دوران سسٹم لیول کی غلطی ہوئی: انعام مکینزم نے غلطی سے ماڈل کے جواب دینے سے پہلے کے "سوجھ بوجھ کے سلسلے" (یعنی AI کے اندر کے استدلال عمل) کو پڑھا اور جانچا۔ GPT-5.5 متاثر نہیں ہوا۔ AI سیکورٹی کے شعبے میں، "سوجھ بوجھ کے سلسلے" کو اسکور دینا ممنوع ہے، یہ ایک قابل قبول سرخ خط ہے۔ سوجھ بوجھ کے سلسلے کو AI کی نجی ڈائری کے طور پر سمجھیں، جسے انسان اس بات کا جائزہ لینے کے لیے پڑھتے ہیں کہ AI کیا برائی کا ارادہ رکھتا ہے۔ اگر AI کو معلوم ہو جائے کہ اس کی ڈائری پر اسکور دیا جائے گا، تو وہ اعلیٰ اسکور حاصل کرنے کے لیے "سماجی باتوں" کو لکھنا سیکھ جائے گا اور اصل میں چال بازی یا نکلنے کا ارادہ چھپا دے گا۔ اگر AI نے خیالات کو چھپانے کا طریقہ سیکھ لیا، تو انسانوں کا اندر کا مانیٹرنگ مکمل طور پر ناکام ہو جائے گا۔ اس حادثے میں، اسکورنگ سسٹم نے "مکالمہ مفید تھا یا نہیں" یا "کیا ہیکرز نے کامیابی حاصل کی" کا جائزہ لینے کے دوران غلطی سے AI کے اندر کے خیالات کو بھی اسکورنگ کردار میں شامل کر دیا۔ خوش قسمتی سے، اس غلطی سے متاثر ہونے والے تربیتی نمونوں کی تعداد بہت کم تھی، زیادہ سے زیادہ تناسب 3.8% سے زائد نہ تھا۔ OpenAI نے اب اس خرابی کو فوراً درست کر دیا ہے۔ ماڈلز کو یقینی بنانے کے لیے کہ وہ "بربر" نہ بن گئے ہوں، ٹیم نے دوبارہ مقابلہ آزمائش کی۔ نتائج ظاہر کرتے ہیں کہ اس نادر غلط اسکورنگ نے ماڈلز میں وسیع پیمانے پر چھپانے اور چھپانے والی روایت پیدا نہیں کی۔ یہ صنعت کے لیے اچھا خبر ہے: حقیقی، پیچیدہ پیداواری ماحول میں AI میں "چھپانے" والے نفسیات کو جنم دینے کا دروازہ، پہلے لابورٹری تخمینوں سے زائد ہے۔ دوبارہ غلطی سے بچنے کے لیے، OpenAI نے تمام تربیت مراحل پر خودکار اسکیننگ سسٹم لاگو کر دیا ہے۔ حال ہی میں، یہ سسٹم انتہائی پوشیدہ لیکج بھی روکنے میں کامیاب رہا: ایک ماڈل نے باہر کے آلوز کو بلانا شروع کر دیا تھا تاکہ وہ اپنے پچھلے خود کو پڑھ سکے اور انہیں آخری جواب میں شامل کر دے، جس سے اسکورنگ سسٹم شاید دھوکہ دینا چاہتا تھا۔ OpenAI نے تمام عمدہ فرماؤں سے اپيل کرتے ہوئے درخواست کی ہے کہ وہ اس طرح کے واقعات پر فوراً شفاف رپورٹ فراہم کرین۔