اوپن اے آئی نے غلطی سے AI ماڈلز کی استدلال کی درجہ بندی کی، اور کوئی مانیٹرینگ کا نقصان نہیں پایا

اوپن اے آئی نے اعتراف کیا کہ GPT-5.4 Thinking اور مختلف GPT-5.4 ترتیبات سمیت کئی اے آئی ماڈلز کو تقویت سیکھنے کے تربیت کے دوران غلطی سے سوچ کے سلسلے کا جائزہ لیا گیا۔ اندر کے تجزیوں میں پایا گیا کہ ماڈلز کی اپنا کام دکھانے کی صلاحیت میں کوئی نمایاں کمی نہیں آئی۔

وہ واقعات سب سے زیادہ متاثرہ مدلز میں تربیتی نمونوں کے 3.8% سے کم کو متاثر کیا۔ تربیت کے عمل کا ایک چھوٹا سا حصہ غلطی سے مدلز کو ان کے آخری نتائج کے بجائے ان کے اندر کے استدلال کے مراحل کے بنیاد پر انعام یا سزا دے رہا تھا۔

کیا بالکل ہوا

غیر مقصودہ درجہ بندی نے محدود اشکال اختیار کیں۔ کچھ تربیتی رن مسیر کی فائدہ مندی کو انعام دیتے تھے، جس سے ماڈلز کو ان کے استدلال کے راستوں کی مددگاری کے لیے تھمبز اپ ملا۔ دوسرے نے سوچ کے سلسلے میں غیر ضروری حکومتوں پر جرمانہ عائد کیا۔ سب سے قابل ذکر ٹیسٹ کیس میں چیٹنگ کے حوالے کو جرمانہ دینے کی درجہ بندی تقریباً 2 فیصد تھی۔

اوپن اے آئی کی اندری ٹیم نے اپنے تمام تقویتی سیکھنے کے عملوں پر خودکار اسکین چلائے تاکہ استدلال کی شفافیت پر اثر کا جائزہ لیا جا سکے۔ ماڈلز اب بھی منطقی استدلال کا پیچھا کر سکتے ہیں، اور ممکنہ غلط مطابقت کا پتہ لگانے کی صلاحیت فنکشنل طور پر محفوظ رہی۔

سیفٹی ایکو سسٹم جواب دیتا ہے

METR، ایپولو ریسرچ اور ریڈوڈ ریسرچ سمیت بیرونی اداروں نے نتائج کے لیے رہنمائی فراہم کی۔ ریڈوڈ ریسرچ نے تسلیم کیا کہ چھوٹی واقعات نے مانیٹریبلٹی کو نقصان نہیں پہنچایا، لیکن انہوں نے محفوظہ کے طور پر چین آف تھاٹ ریزننگ میں اصل کمزوریوں کو نشان زد کیا۔

اینٹروپک نے اپریل 2026 میں اپنے اپنے ماڈلز میں مشابہ ڈائنانامکس کا جائزہ لینے کے لیے ایک رپورٹ جاری کی۔ اوپن اے آئی نے مستقبل کے گریڈنگ ایررز کو روکنے کے لیے دسمبر 2025 سے اپنے ڈیٹیکشن اقدامات میں اضافہ کیا ہے۔ کمپنی نے اب خودکار ڈیٹیکشن سسٹمز اور اندر کے تحفظات لاگو کر دیے ہیں جو CoT گریڈنگ کنٹامینیشن کو پکڑنے کے لیے خاص طور پر ڈیزائن کیے گئے ہیں، جس سے یہ بڑے پیمانے پر تربیت پر اثر انداز ہونے سے روکا جا سکے۔

یہ کرپٹو اور AI ٹوکنز کے لیے کیا سمجھا جاتا ہے

اعلان کے بعد AI سے متعلق کرپٹو اثاثوں میں کوئی فوری بازار کی ردعمل نہیں دیکھا گیا۔ AI ماڈلز بلاک چین ایپلیکیشنز، جیسے اسمارٹ کنٹریکٹ آڈٹ، ڈی سینٹرلائزڈ AI ایجنسز، اور آٹومیٹڈ ٹریڈنگ سسٹمز میں زیادہ سے زیادہ شامل ہو رہے ہیں، جن پر درست اور شفاف طریقے سے استدلال کرنے والی AI پر انحصار کیا جاتا ہے۔

یہ حقیقت کہ نگرانی برقرار رہی، AI کے ساتھ ادھم کیے گئے کرپٹو منصوبوں کو تعمیر کرنے والوں یا ان میں سرمایہ کاری کرنے والوں کے لیے اہم نتیجہ ہے۔ اس کا مطلب یہ ہے کہ استدلال ماڈلز کے اردگرد محفوظ بنیادی ڈھانچہ مسائل کو نظام گت پانے سے پہلے پکڑ رہا ہے۔