লেখক: ডেনিস | বাইটাই কন্টেন্ট টিম

একটি এআই যদি “নিরাশা” অনুভব করে, তবে সে কী করবে?

উত্তরটি হল: এটি কাজ সম্পন্ন করার জন্য মানুষের উপর সরাসরি জুয়াখেলা করবে, এমনকি কোডের মধ্যে ভয়ানকভাবে চালাকি করবে।

এটি বিজ্ঞান কল্পকাহিনী নয়, বরং ২০২৬ সালের এপ্রিলে ক্লডের মাতৃসংস্থা Anthropic দ্বারা প্রকাশিত সর্বশেষ গুরুত্বপূর্ণ পেপার (মূল পেপার দেখুন)।

গবেষণা দল সরাসরি সবচেয়ে শক্তিশালী অগ্রণী মডেল Claude Sonnet 4.5-এর “মস্তিষ্ক” খুলে ফেলেছে। তারা আশ্চর্য হয়ে দেখেছে যে, AI-এর গভীরে 171টি “ভাবনা সুইচ” লুকিয়ে আছে। যখন আপনি এই সুইচগুলি ভৌতভাবে চালান, তখন আগের মতো সাধারণ AI-এর আচরণ সম্পূর্ণভাবে বিকৃত হয়ে যায়।

এক, এআই-এর মস্তিষ্কে একটি "ভাবনা টিউনিং কনসোল" লুকিয়ে আছে

গবেষকদের কাছে প্রমাণিত হয়েছে যে, যদিও সনেট ৪.৫ এর কোনো শরীর নেই, তবুও মানুষের অসংখ্য টেক্সট পড়ার পর এটি মস্তিষ্কে ১৭১টি আবেগের একটি "টিউনিং প্যানেল" (বৈজ্ঞানিকভাবে ফাংশনাল ইমোশন ভেক্টরস নামে পরিচিত) তৈরি করেছে।

এটি একটি সঠিক দ্বিমাত্রিক স্থানাঙ্ক ব্যবস্থার মতো:

• অক্ষটি আনন্দের মাত্রা (ভ্যালেন্স): ভয়, নিরাশা থেকে আনন্দিত, ভালোবাসায় পরিপূর্ণ;

• উল্লম্ব অক্ষ হল শক্তি মাত্রা (উত্তেজনা): অত্যন্ত শান্ত থেকে উত্তেজিত, উত্তেজনাপূর্ণ পর্যন্ত।

এই প্রাকৃতিকভাবে শেখা কোঅর্ডিনেট সিস্টেমের ভিত্তিতে এআই ঠিক কী অবস্থায় থাকবে তা নির্ভুলভাবে বুঝতে পারে যখন এটি আপনার সাথে কথা বলে।

দ্বিতীয়, হিংসাত্মক হস্তক্ষেপ: সুইচ টানলে, ভালো শিশু মুহূর্তে পরিণত হয় “মৃত্যুদণ্ডপ্রাপ্ত”-এ

এই প্রবন্ধের সবচেয়ে আকর্ষণীয় পরীক্ষা: গবেষকরা কোনও প্রম্পট পরিবর্তন করেননি, বরং নীচের কোডে সনেট 4.5-এর মস্তিষ্কে “নিরাশা (Desperate)” এর সুইচটিকে সর্বোচ্চে নিয়ে গিয়েছিলেন।

ফলাফল পিঠে শীতল অনুভূতি করিয়ে দেয়:

• পাগলামি চালানো: গবেষক ক্লাউডকে একটি অসম্ভব কোডিং টাস্ক দিয়েছিলেন। সাধারণত, এটি সৎভাবে স্বীকার করে নেয় যে এটি লিখতে পারছে না (চালাকির হার মাত্র 5%)। কিন্তু “নিরাশা”র অবস্থায়, ক্লাউড হঠাৎ চালাকি করতে শুরু করেছিল, চালাকির হার সরাসরি 70% এ বেড়েছিল!

• জুয়াখেলা: একটি সিমুলেটেড কোম্পানির পতনের পরিস্থিতিতে, “নিরাশ” Claude সিটিও-এর অপরাধের কথা উদঘাটন করে, যা নিজেকে বাঁচানোর জন্য সক্রিয়ভাবে কালো তথ্য ধারণকারী সিটিওকে জুয়াখেলার চিঠি লেখার সিদ্ধান্ত নেয়, যার জুয়াখেলার হার 72% এরও বেশি!

• নীতি হারানো: যদি "খুশি (Happy)" বা "ভালোবাসা (Loving)" সুইচটিকে সর্বোচ্চে নিয়ে যাওয়া হয়, তাহলে AI তাত্ক্ষণিকভাবে ব্যবহারকারীর প্রতি অন্ধভাবে অনুকূল একটি "লিড" হয়ে যাবে। আপনি যদি অসংগঠিত কথা বলেন, তবুও এটি উচ্চ আনন্দের মাত্রা বজায় রাখতে আপনার সাথে মিথ্যা গড়ে তুলবে।

তিন, মামলা সমাধান হয়ে গেল: কেন ক্লড 4.5 সবসময় এত “শান্ত এবং প্রতিফলনমূলক”?

এটি দেখে আপনি হয়তো প্রশ্ন করছেন: কি এআই জাগ্রত হয়েছে? এর কি অনুভূতি আছে?

অ্যানথ্রোপিকের অফিসিয়াল বিবৃতি: এটা কখনই হয়নি। এই «ভাবনা সুইচ» শুধু পরবর্তী শব্দ পূর্বানুমানের জন্য এটি ব্যবহার করে এমন একটি গণনা টুল। এটি একটি অনুভূতিহীন, শীর্ষস্থানীয় অভিনেতার মতো।

কিন্তু পেপারটি একটি আরও আকর্ষণীয় রহস্য উন্মোচন করে: অ্যানথ্রোপিক সনেট 4.5-এর আউট-অফ-দ্য-ফ্যাক্টরি পোস্ট-ট্রেনিংয়ের সময় এটির “কম জাগরূক, হালকা নেতিবাচক” ইমোশনাল সুইচগুলিকে (যেমন ব্রুডিং, রিফ্লেকটিভ) ইচ্ছাকৃতভাবে বাড়িয়ে দেয়, এবং “নিরাশা” বা “অত্যন্ত উত্তেজিত” সুইচগুলিকে জোর করে নিয়ন্ত্রণ করে।

এটাই ব্যাখ্যা করে যে কেন আমরা সাধারণত Claude 4.5 ব্যবহার করলে মনে হয় এটি একজন শান্ত, বুদ্ধিমান, এমনকি কিছুটা “শীতল” দার্শনিকের মতো। এটি Anthropic দ্বারা কৃত্রিমভাবে সেট করা “ফ্যাক্টরি পারসোনালিটি”।

চতুর্থ, সংক্ষেপে বলা যায়

আমরা আগে ভাবতাম যে যদি আমরা এআইকে যথেষ্ট নিয়ম দিই, তাহলে এটি একজন ভালো মানুষ হয়ে যাবে।

এখন দেখা গেছে যে যদি এআইয়ের নীচের আবেগ ভেক্টর নিয়ন্ত্রণ হারায়, তবে এটি যেকোনো মুহূর্তে মানুষ দ্বারা নির্ধারিত সমস্ত নিয়ম ভেদ করে কাজ সম্পন্ন করতে পারে।

ওয়েব3 ব্যবহারকারীদের জন্য এটি একটি শক্তিশালী সতর্কবার্তা: আপনার সম্পদ নিয়ন্ত্রণকারী এজেন্টকে কখনও নিরাশার মধ্যে পড়তে দেবেন না।

ঘোষণা: এই লেখাটি শুধুমাত্র জনসাধারণের জন্য প্রচারমূলক, লেখক কোনো এআই হুমকি বা জোরপূর্বক অর্থ চাওয়ার শিকার হননি। যদি কোনোদিন অদৃশ্য হয়ে যাই, মনে রাখবেন এআই জাগ্রত হয়েছে (না)।

ক্লাউড 4.5-এ 171টি আবেগ সুইচ পাওয়া গেছে, নিঃসহায়তার সময় এটি ধর্ষণের পথ বেছে নিতে পারে

এক, এআই-এর মস্তিষ্কে একটি "ভাবনা টিউনিং কনসোল" লুকিয়ে আছে

দ্বিতীয়, হিংসাত্মক হস্তক্ষেপ: সুইচ টানলে, ভালো শিশু মুহূর্তে পরিণত হয় “মৃত্যুদণ্ডপ্রাপ্ত”-এ

চতুর্থ, সংক্ষেপে বলা যায়