ওপেনএআই অকস্মাৎ এআই মডেলগুলির যুক্তিবিদ্যা মূল্যায়ন করে, কোনো মনিটরিংয়ের ক্ষতি পায়নি

ওপেনএআই প্রকাশ করেছে যে জিপিটি-৫.৪ থিংকিং এবং বিভিন্ন জিপিটি-৫.৪ ইটারেশনসহ এর কিছু এআই মডেলে শক্তিশালী শিক্ষার প্রশিক্ষণের সময় অকস্মাৎ চেইন-অফ-থট গ্রেডিং ঘটেছে। অভ্যন্তরীণ বিশ্লেষণে দেখা গেছে যে মডেলগুলির তাদের কাজ দেখানোর ক্ষমতায় কোনও উল্লেখযোগ্য হ্রাস হয়নি।

সবচেয়ে প্রভাবিত মডেলগুলিতে এই ঘটনাগুলি প্রশিক্ষণ নমুনাগুলির 3.8% এর কমকে প্রভাবিত করেছে। প্রশিক্ষণ প্রক্রিয়ার একটি ক্ষুদ্র অংশ দুর্ঘটনাবশত মডেলগুলির অন্তর্নিহিত যুক্তির ধাপগুলির ভিত্তিতে পুরস্কার বা শাস্তি দিয়েছে, শুধুমাত্র তাদের চূড়ান্ত আউটপুটের ভিত্তিতে নয়।

কী আসলে ঘটেছিল

অকস্মাত মূল্যায়ন সীমিত রূপ নিয়েছিল। কিছু প্রশিক্ষণ চালনায় ট্রাজেক্টরির উপযোগিতা পুরস্কৃত হয়েছিল, যা মডেলগুলিকে তাদের যুক্তির পথগুলির সহায়কতার জন্য থাম্স-আপ দিয়েছিল। অন্যগুলি চিন্তার শৃঙ্খলের মধ্যে অপ্রয়োজনীয় প্রম্পটগুলিকে শাস্তি দিয়েছিল। সবচেয়ে উল্লেখযোগ্য পরীক্ষার ক্ষেত্রে CoT-এর প্রতি ধোঁকাবাজির উল্লেখের জন্য প্রায় 2% শাস্তির হার দেখা গিয়েছিল।

ওপেনএআইয়ের অভ্যন্তরীণ দল তাদের সমস্ত শক্তিকরণ শেখার চালানের উপর স্বয়ংক্রিয় স্ক্যান চালিয়ে যুক্তিগত স্বচ্ছতার উপর প্রভাব পরীক্ষা করেছে। মডেলগুলি এখনও বিশ্বস্তভাবে যুক্তিগত যুক্তি ট্রেস করতে পারছে, এবং সম্ভাব্য অসামঞ্জস্যতা শনাক্তকরণের ক্ষমতা কার্যকরভাবে অক্ষত রয়েছে।

নিরাপত্তা বাস্তুতন্ত্র প্রতিক্রিয়া জানায়

METR, অ্যাপোলো রিসার্চ এবং রেডউড রিসার্চ সহ বাহ্যিক সংগঠনগুলি এই প্রতিবেদনের জন্য দৃষ্টিভঙ্গি প্রদান করেছে। রেডউড রিসার্চ স্বীকার করেছে যে ক্ষুদ্র ঘটনাগুলি মনিটরযোগ্যতাকে ক্ষতি করেনি, তবে নিরাপত্তার জন্য চেইন-অফ-থought রিজনিংয়ের অন্তর্নিহিত দুর্বলতা উল্লেখ করেছে।

এপ্রিল ২০২৬-এ এনথ্রোপিক তাদের নিজস্ব মডেলগুলিতে সদৃশ গতিবিধি পরীক্ষা করে একটি প্রতিবেদন প্রকাশ করেছে। ভবিষ্যতের গ্রেডিং ত্রুটি প্রতিরোধে ওপেনএআই ডিসেম্বর ২০২৫-এর পর থেকে তাদের শনাক্তকরণ পদ্ধতি বাড়িয়েছে। কোম্পানিটি এখন স্বয়ংক্রিয় শনাক্তকরণ সিস্টেম এবং অভ্যন্তরীণ সুরক্ষা বাস্তবায়ন করেছে, যা CoT গ্রেডিং দূষণকে বড় পরিসরে প্রশিক্ষণকে প্রভাবিত করার আগেই ধরে ফেলার জন্য বিশেষভাবে ডিজাইন করা হয়েছে।

ক্রিপ্টো এবং এআই টোকেনের জন্য এটির অর্থ কী

ঘোষণার পর এআই-সংক্রান্ত ক্রিপ্টো সম্পদে কোনো তাৎক্ষণিক বাজার প্রতিক্রিয়া দেখা যায়নি। এআই মডেলগুলি ব্লকচেইন অ্যাপ্লিকেশনে বাড়তি ভাবে এমবেড হচ্ছে, যার মধ্যে রয়েছে স্মার্ট চুক্তি অডিট, ডিসেন্ট্রালাইজড এআই এজেন্ট এবং অটোমেটেড ট্রেডিং সিস্টেম, যার সবগুলি সঠিক এবং স্বচ্ছভাবে যুক্তি দেওয়ার এআই-এর উপর নির্ভরশীল।

মনিটরিংয়ের অখণ্ডতা বজায় থাকাই হল এআই-সংযুক্ত ক্রিপ্টো প্রকল্প তৈরি বা বিনিয়োগ করছেন এমন যাদের জন্য প্রধান বিষয়। এর মানে হল যুক্তিসম্পন্ন মডেলগুলির চারপাশের নিরাপত্তা অবস্থা সমস্যাগুলি প্রায়শই সিস্টেমিক হওয়ার আগেই ধরে ফেলছে।