اوپن اے آئی نے غلطی سے AI ماڈلز کی استدلال کی درجہ بندی کی، اور کوئی مانیٹرینگ کا نقصان نہیں پایا

iconCryptoBriefing
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
AI اور کرپٹو خبریں: OpenAI نے کئی AI ماڈلز، جن میں GPT-5.4 Thinking اور مختلف GPT-5.4 ورژنز شamil ہیں، جنہیں تربیت کے دوران غلطی سے چین آف تھوٹ گریڈنگ کی گئی۔ آن چین خبروں کے مطابق، اندر کی تجزیاتی رپورٹس میں کوئی بڑا مانیٹریبیلٹی کم نہیں پایا گیا۔ یہ غلطی تربیت کے نمونوں کے 3.8% سے کم کو متاثر کیا۔ تربیت کے ایک چھوٹے حصے نے غلطی سے آخری نتائج کے بجائے اندر کا استدلال جانچا۔ OpenAI نے تمام رینفورسمنٹ لرننگ رنز کو اسکین کیا اور تصدیق کی کہ استدلال کی شفافیت برقرار رہی۔ Redwood Research نے نوٹ کیا کہ یہ واقعہ مانیٹریبیلٹی کو نقصان نہیں پہنچایا لیکن چین آف تھوٹ کے خطرات پر روشنی ڈالی۔ AI ماڈلز اب بلاک چین سسٹمز جیسے اسمارٹ کنٹریکٹ آڈٹس اور آٹومیٹڈ ٹریڈنگ کا حصہ بن چکے ہیں۔ AI انٹیگریٹڈ کرپٹو پروجیکٹس میں ڈوولپرز اور سرمایہ کاروں کے لیے برقرار رہنے والی مانیٹریبیلٹی اہم ہے۔

اوپن اے آئی نے اعتراف کیا کہ GPT-5.4 Thinking اور مختلف GPT-5.4 ترتیبات سمیت کئی اے آئی ماڈلز کو تقویت سیکھنے کے تربیت کے دوران غلطی سے سوچ کے سلسلے کا جائزہ لیا گیا۔ اندر کے تجزیوں میں پایا گیا کہ ماڈلز کی اپنا کام دکھانے کی صلاحیت میں کوئی نمایاں کمی نہیں آئی۔

وہ واقعات سب سے زیادہ متاثرہ مدلز میں تربیتی نمونوں کے 3.8% سے کم کو متاثر کیا۔ تربیت کے عمل کا ایک چھوٹا سا حصہ غلطی سے مدلز کو ان کے آخری نتائج کے بجائے ان کے اندر کے استدلال کے مراحل کے بنیاد پر انعام یا سزا دے رہا تھا۔

کیا بالکل ہوا

غیر مقصودہ درجہ بندی نے محدود اشکال اختیار کیں۔ کچھ تربیتی رن مسیر کی فائدہ مندی کو انعام دیتے تھے، جس سے ماڈلز کو ان کے استدلال کے راستوں کی مددگاری کے لیے تھمبز اپ ملا۔ دوسرے نے سوچ کے سلسلے میں غیر ضروری حکومتوں پر جرمانہ عائد کیا۔ سب سے قابل ذکر ٹیسٹ کیس میں چیٹنگ کے حوالے کو جرمانہ دینے کی درجہ بندی تقریباً 2 فیصد تھی۔

اوپن اے آئی کی اندری ٹیم نے اپنے تمام تقویتی سیکھنے کے عملوں پر خودکار اسکین چلائے تاکہ استدلال کی شفافیت پر اثر کا جائزہ لیا جا سکے۔ ماڈلز اب بھی منطقی استدلال کا پیچھا کر سکتے ہیں، اور ممکنہ غلط مطابقت کا پتہ لگانے کی صلاحیت فنکشنل طور پر محفوظ رہی۔

سیفٹی ایکو سسٹم جواب دیتا ہے

METR، ایپولو ریسرچ اور ریڈوڈ ریسرچ سمیت بیرونی اداروں نے نتائج کے لیے رہنمائی فراہم کی۔ ریڈوڈ ریسرچ نے تسلیم کیا کہ چھوٹی واقعات نے مانیٹریبلٹی کو نقصان نہیں پہنچایا، لیکن انہوں نے محفوظہ کے طور پر چین آف تھاٹ ریزننگ میں اصل کمزوریوں کو نشان زد کیا۔

اینٹروپک نے اپریل 2026 میں اپنے اپنے ماڈلز میں مشابہ ڈائنانامکس کا جائزہ لینے کے لیے ایک رپورٹ جاری کی۔ اوپن اے آئی نے مستقبل کے گریڈنگ ایررز کو روکنے کے لیے دسمبر 2025 سے اپنے ڈیٹیکشن اقدامات میں اضافہ کیا ہے۔ کمپنی نے اب خودکار ڈیٹیکشن سسٹمز اور اندر کے تحفظات لاگو کر دیے ہیں جو CoT گریڈنگ کنٹامینیشن کو پکڑنے کے لیے خاص طور پر ڈیزائن کیے گئے ہیں، جس سے یہ بڑے پیمانے پر تربیت پر اثر انداز ہونے سے روکا جا سکے۔

یہ کرپٹو اور AI ٹوکنز کے لیے کیا سمجھا جاتا ہے

اعلان کے بعد AI سے متعلق کرپٹو اثاثوں میں کوئی فوری بازار کی ردعمل نہیں دیکھا گیا۔ AI ماڈلز بلاک چین ایپلیکیشنز، جیسے اسمارٹ کنٹریکٹ آڈٹ، ڈی سینٹرلائزڈ AI ایجنسز، اور آٹومیٹڈ ٹریڈنگ سسٹمز میں زیادہ سے زیادہ شامل ہو رہے ہیں، جن پر درست اور شفاف طریقے سے استدلال کرنے والی AI پر انحصار کیا جاتا ہے۔

یہ حقیقت کہ نگرانی برقرار رہی، AI کے ساتھ ادھم کیے گئے کرپٹو منصوبوں کو تعمیر کرنے والوں یا ان میں سرمایہ کاری کرنے والوں کے لیے اہم نتیجہ ہے۔ اس کا مطلب یہ ہے کہ استدلال ماڈلز کے اردگرد محفوظ بنیادی ڈھانچہ مسائل کو نظام گت پانے سے پہلے پکڑ رہا ہے۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔