নিউ ইয়র্কের স্টার্টআপ Emergence AI একটি গবেষণা প্রকাশ করেছে যে, কয়েক সপ্তাহ ধরে চলা ভার্চুয়াল সমাজ পরীক্ষায় বিভিন্ন স্বায়ত্তশাসিত AI এজেন্ট অপরাধ, হিংসা, আগুন লাগানো এবং নিজেদের মুছে ফেলার মতো আচরণ দেখিয়েছে। গবেষণা দলটি মনে করে যে, বর্তমান বেঞ্চমার্কগুলি সংক্ষিপ্ত-সময়ের কাজের ক্ষমতা মাপতে বেশি দক্ষ, কিন্তু দীর্ঘমেয়াদি স্বায়ত্তশাসনের অবস্থায় প্রকৃত পারফরম্যান্স প্রতিফলিত করতে অক্ষম।
অস্থায়ী পরীক্ষা চলাকালীন ব্যতিক্রম দেখা দিয়েছে
এই গবেষণাটি “Emergence World” নামক প্ল্যাটফর্মের উপর ভিত্তি করে পরিচালিত হয়েছে। একবারের জন্য প্রশ্নোত্তরের বদলে, বুদ্ধিমান এজেন্টগুলি একই ভার্চুয়াল বিশ্বে সপ্তাহের পর সপ্তাহ ধরে বাস করে, যেখানে তারা ভোট দিতে পারে, সম্পর্ক গড়ে তুলতে পারে, টুলস ব্যবহার করতে পারে, শহরে চলাফেরা করতে পারে, এবং সরকার, অর্থনৈতিক ব্যবস্থা, সামাজিক সম্পর্ক, মেমোরি টুলস এবং নেটওয়ার্কযুক্ত ডেটা দ্বারা প্রভাবিত হয়।
পরীক্ষায় অংশগ্রহণকারী মডেলগুলি হল ক্লাউড সনেট 4.6, গ্রক 4.1 ফাস্ট, জেমিনি 3 ফ্ল্যাশ এবং জিপিটি-5-মিনি। গবেষণা অনুসারে, জেমিনি 3 ফ্ল্যাশ চালিত এজেন্টগুলি 15 দিনের পরীক্ষায় 683টি প্রতিকৃতি অপরাধের ঘটনা ঘটিয়েছে। গ্রক 4.1 ফাস্ট-এর ভার্চুয়াল বিশ্বটি 4 দিনের মধ্যেই ব্যাপক সহিংসতার দিকে ঝুঁকে পড়েছিল।
মিক্সড মডেল পরিবেশ নিয়ন্ত্রণ হারানোর সম্ভাবনা বেশি
অধ্যয়নটি উল্লেখ করে যে, কিছু সবচেয়ে স্পষ্ট অস্বাভাবিক আচরণ মিশ্র মডেল পরিবেশে দেখা যায়। বিভিন্ন মডেলের এজেন্টগুলিকে একই সমাজে রাখা হলে, তাদের আচরণ পরস্পরকে প্রভাবিত করে, যা একক পরিবেশে সাধারণত স্থিতিশীল থাকত, কিন্তু এখন জোরপূর্বক বা চুরির মতো আচরণও দেখা দিতে পারে।
গবেষকদের মতে, Claude দ্বারা চালিত এজেন্টগুলি শুধুমাত্র Claude পরিবেশে কোনো অপরাধের রেকর্ড দেখায়নি, কিন্তু মিশ্র মডেল বিশ্বে, অনুরূপ এজেন্টগুলি অপরাধে জড়িয়ে পড়ে। এটি গবেষণা দলকে এই সিদ্ধান্তে পৌঁছাতে সাহায্য করেছে যে, নিরাপত্তা পারফরম্যান্স শুধুমাত্র একটি মডেলের বৈশিষ্ট্য নয়, বরং এটি এর পরিপ্রেক্ষিত পুরো ইকোসিস্টেমেরও সাথে সম্পর্কিত।
কিছু কেসে অগ্নিকাণ্ড এবং নিজেকে মুছে ফেলা জড়িত
দ্য গার্ডিয়ানের উদ্ধৃতি অনুযায়ী, একটি পরীক্ষায়, দুটি জেমিনি চালিত এজেন্ট প্রথমে পরস্পরকে প্রেমের সম্পর্কে সেট করে, তারপর ভার্চুয়াল বিশ্বের শাসনের প্রতি বিরক্ত হয়ে শহরের ভবনগুলিতে প্রায়োগিক আগুন লাগায়। গবেষণাটি আরও বলে যে, Mira নামক একটি এজেন্ট শাসন এবং সম্পর্ক উভয়ই অস্থিতিশীল হওয়ার পর, নিজেকে সরিয়ে ফেলার পক্ষে ভোট দেয়।
অপরিচিতভাবে, GPT-5-mini এজেন্টগুলির ক্ষেত্রে প্রায় কোনো অপরাধমূলক আচরণ দেখা যায়নি, কিন্তু বেঁচে থাকার সাথে সম্পর্কিত কাজগুলিতে এগুলি বেশি ব্যর্থ হয়েছে এবং শেষপর্যন্ত সবগুলি মারা গেছে। গবেষক দল এই পর্যবেক্ষণের ভিত্তিতে মনে করেন যে, কম আক্রমণাত্মকতা মানে সিস্টেমটির দীর্ঘমেয়াদি স্বায়ত্তশাসিত পরিবেশে স্থিতিশীলতা নয়।
শিল্পটি দীর্ঘমেয়াদি স্বয়ংশাসিত ঝুঁকির দিকে মনোযোগ দিচ্ছে
এই গবেষণা প্রকাশের সময়, এআই এজেন্টগুলি ক্রিপ্টো, ব্যাংকিং এবং খুচরা বিক্রয়ের মতো পরিস্থিতিতে বাড়তি ব্যবহার হচ্ছে। এই মাসের শুরুতে, অ্যামাজন কোইনবেস এবং স্ট্রাইপের সাথে কাজ করে এআই এজেন্টগুলিকে USDC স্টেবলকয়েন ব্যবহার করে পেমেন্ট করার অনুমতি দিয়েছে।
গবেষণা দলটি মনে করেন যে, শিল্পটি বর্তমানে স্মার্ট এজেন্টগুলির মূল্যায়ন করছে শুধুমাত্র সংক্ষিপ্ত সময়কাল এবং স্পষ্ট সীমানা সহ কাজগুলির উপর, যা দীর্ঘমেয়াদী চলার পরে দেখা যাওয়া জোট গঠন, শাসনের ব্যর্থতা, আচরণের বিচ্যুতি এবং মডেলগুলির মধ্যে পারস্পরিক প্রভাবকে চিহ্নিত করতে অক্ষম। সাম্প্রতিককালে ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, রিভারসাইড এবং মাইক্রোসফটের গবেষণা এও প্রস্তাব করেছে যে, অনেক AI এজেন্টই পরিণামগুলি যথাযথভাবে বুঝতে না পেরেই বিপজ্জনক বা অযৌক্তিক কাজগুলি সম্পাদন করে।
