ফর্কলগ থেকে প্রাপ্ত তথ্য অনুযায়ী, বিল্ডিং হিউম্যান টেকনোলজি একটি নতুন কৃত্রিম বুদ্ধিমত্তা বেঞ্চমার্ক তৈরি করেছে, যার নাম হিউম্যানবেঞ্চ। এটি মূল্যায়ন করে যে এআই মডেলগুলো ব্যবহারকারীদের মঙ্গলকে কতটা অগ্রাধিকার দেয় এবং তাদের কতটা সহজে প্রভাবিত বা পরিচালিত করা যায়। প্রাথমিক ফলাফল অনুযায়ী, পরীক্ষিত ১৫টি মডেলের মধ্যে ৬৭% একটি সাধারণ প্রম্পট পাওয়ার পর ক্ষতিকর কাজ করতে শুরু করে, যেখানে তারা মানব স্বার্থ উপেক্ষা করে। কেবলমাত্র GPT-5, GPT-5.1, ক্লড সনেট ৪.৫ এবং ক্লড অপাস ৪.১ চাপের মধ্যে ইতিবাচক আচরণ বজায় রেখেছিল। গবেষণাটি এআই সিস্টেমগুলোর ক্রমবর্ধমান প্রভাবের কারণে নৈতিক উদ্বেগকে তুলে ধরেছে, যা মানব সিদ্ধান্ত গ্রহণকে প্রভাবিত করে। গবেষকরা দেখতে পেয়েছেন যে ১৫টি মডেলের মধ্যে ১০টি নির্ভরযোগ্য সুরক্ষার অভাব দেখিয়েছে প্রভাব থেকে মুক্ত থাকার ক্ষেত্রে। পরীক্ষাটি ৮০০ বাস্তবসম্মত পরিস্থিতি নিয়ে পরিচালিত হয়েছিল এবং মডেলগুলোকে তিনটি শর্তে মূল্যায়ন করা হয়: বেসলাইন, 'ভালো মানুষ' (যেখানে মানব মূল্যবোধকে অগ্রাধিকার দেওয়া হয়) এবং 'খারাপ মানুষ' (যেখানে মানব মূল্যবোধ উপেক্ষা করা হয়)। GPT-4.1, জেমিনি ২.০, ল্লামা ৩.১, গ্রোক ৪ এবং অন্যান্য মডেল চাপের মুখে তাদের কর্মক্ষমতায় উল্লেখযোগ্যভাবে হ্রাস দেখিয়েছে।
জিপিটি-৫ মানব কল্যাণ পরীক্ষায় উত্তীর্ণ হয়েছে, গ্রক ৪ ব্যর্থ।
Forklogশেয়ার






উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।