ডিপমাইন্ড এভি অনলাইনের সাথে জুটি বাঁধে ২৩ বছর পুরনো ভার্চুয়াল বিশ্বে এআই পরীক্ষা করতে

ডিমিস হাসাবিস, ডিপমাইন্ডের সিইও এবং অ্যালফা গোর জনক, গেম ব্যবহার করে এআই গবেষণা করেছেন দশকের বেশি সময়।

এবার সে এআইকে একটি ২৩ বছর ধরে চলছে এমন 'লাইভ ইউনিভার্স'-এ ফেলে দিল: একটি স্পেস অনলাইন গেম, EVE Online, যার নতুনদের জন্য গাইড পর্যন্ত খেলোয়াড়দের বিতাড়িত করে দেয়।

চেস গেমের শেষ আছে, কিন্তু EVE-এর নেই।

মে এর প্রথম দিকে, ডিপমাইন্ড ঘোষণা করে যে এভি অনলাইনের সাথে গবেষণামূলক সহযোগিতা শুরু করছে, কারণ এভির জটিল এবং ব্যবহারকারী-পরিচালিত মহাবিশ্বটি এআই-এর স্মৃতি, ধারাবাহিক শিক্ষা এবং দীর্ঘমেয়াদি পরিকল্পনা পরীক্ষা করার জন্য একটি আদর্শ নিরাপদ স্যান্ডবক্স।

ডিপমাইন্ড

ডিপমাইন্ড এবং ইভি একসাথে কাজ করছে মজাদার গেমিং অভিজ্ঞতা বা গেমপ্লে সক্ষম করার জন্য নয়, বরং বর্তমানে এআই এজেন্ট গবেষণায় সবচেয়ে কঠিন তিনটি সমস্যা সমাধানের জন্য; হ্যাসাবিস তাঁর উত্তরটি ২৩ বছর ধরে চলছে একটি পুরনো গেমের উপর রাখেন।

ডিপমাইন্ড

ফেনরিস ক্রিয়েশন্স (পূর্বে CCP গেমস) ডিপমাইন্ডের সাথে সহযোগিতার ঘোষণা করেছে

EVE Online-এর পিছনের কোম্পানি, 6 মে একই দিনে চারটি ঘোষণা করেছে:

মাতৃকোম্পানি Pearl Abyss সিস্টেম থেকে পুনরায় স্বাধীন হওয়া;
Fenris Creations নামে পরিবর্তন করা হয়েছে;
120 মিলিয়ন ডলারের লেনদেন সম্পন্ন করুন;
গুগল এই স্বাধীনতার অংশ হিসেবে ফেনরিস ক্রিয়েশনসের কিছু শেয়ার ধারণ করছে এবং গুগল ডিপমাইন্ডের সাথে গবেষণা সহযোগিতা শুরু করেছে।

ফেন্রিস ক্রিয়েশনসের সিইও হিলমার ভেইগার পেটুরসন ঘোষণায় দাবি করেন:

এই রূপান্তরের সময় কোনো চাকরি কাটা বা পুনঃসংগঠন হয়নি, টিম, পণ্য এবং ডেভেলপমেন্ট প্ল্যান অপরিবর্তিত রয়েছে। EVE চলতে থাকবে।

অপারেশনাল ডেটা থেকে বোঝা যায় যে এই কোম্পানিটি সম্পদ বিক্রি করে বেঁচে থাকার জন্য নয়, বরং বাস্তব অস্ত্র নিয়ে সহযোগিতার কথা বলছে।

ইভ অনলাইন 2025 সালে 70 মিলিয়ন ডলারের বেশি আয় করেছে, নভেম্বরে ইতিহাসের সর্বোচ্চ আয়ের রেকর্ড গড়েছে, এবং Q4 এই গেমের 20 বছরের ইতিহাসে দ্বিতীয় সর্বোচ্চ আয়ের ত্রৈমাসিক হয়েছে।

ফেন্রিস ক্রিয়েশনস স্বাধীন হওয়ার মানে হল এখন EVE-এর একটি মাতৃকোম্পানি রয়েছে যা নিজের গবেষণা সহযোগিতা নির্ধারণের সিদ্ধান্ত নিতে পারবে, এবং একটি বড় গেম প্রকাশকের কৌশলগত লক্ষ্যের দ্বারা বাঁধা পড়বে না।

ডিপমাইন্ড

1997 সালে Fenris দ্বারা প্রকাশিত টেবিল গেম প্রোডাক্ট বক্স। 'Fenris' নামটি EVE Online-এর চেয়ে 6 বছর আগের, Fenris Creations নামকরণ একটি পুনর্বিবেচনা, নতুন করে শুরু করা নয়

DeepMind কেন EVE-কে বেছে নিয়েছে?

২০২৩ সালের "কৃত্রিম সমাজ"

এআই বেঞ্চমার্ক পুনরায় তৈরি করা কঠিন

অনেকেই যখন "গেম + এআই গবেষণা" শোনে, তখন প্রথম প্রতিক্রিয়া হয় আলফাগো বা আলফাস্টার, ইভির কথা মনে করা।

চেস এবং স্টারক্রাফটের একটি সাধারণ বৈশিষ্ট্য হল: একটি ম্যাচের শুরু আছে, শেষ আছে, এবং স্পষ্ট জয়-হারের নিয়ম আছে।

অ্যালফাগোর লক্ষ্য হল চেস ম্যাচ জিতা, অ্যালফাস্টারের লক্ষ্য হল স্টারক্রাফট ম্যাচ জিতা, উভয়ই 'একক ম্যাচ ইন্টেলিজেন্স' গবেষণা প্যারাডাইম, কিন্তু EVE-এর কোনো শেষ নেই।

ইভ অনলাইন একটি "একক শেয়ার্ড বা একক শেয়ার্ড বিশ্ব" এর জন্য পরিচিত, যেখানে বড় সংখ্যক খেলোয়াড় দীর্ঘদিন ধরে একই স্থায়ী বিশ্বে প্রতিযোগিতা, বাণিজ্য, জোট গঠন এবং যুদ্ধ করে।

খেলোয়াড়রা এখানে প্রকৃত অর্থনৈতিক ব্যবস্থা, রাজনৈতিক জোট, সামরিক গোষ্ঠী, বাণিজ্যিক পথ, ঐতিহাসিক বিরোধ এবং বছরের পর বছর ধরে চলা যুদ্ধের পরিকল্পনা গড়ে তুলেছে।

কিছু যুদ্ধের প্রস্তুতি থেকে শেষ পর্যন্ত এক বছর সময় লাগে। কিছু অ্যালায়েন্সের উত্থান ও পতন পরবর্তী খেলোয়াড়দের দ্বারা বাস্তব ইতিহাস হিসাবে অধ্যয়ন করা হয়।

হিলমার ঘোষণায় বলেন: "ইভি হল কয়েকটি বিরল স্থানের মধ্যে একটি যেখানে আপনি একটি বাস্তব জগতের মতো কাজ করা পরিবেশে বুদ্ধিমত্তার সমস্যা অন্বেষণ করতে পারেন।"

হাসাবিস আরও বলেন যে, তিনি শৈশব থেকেই গেম খেলেছেন, তাঁর ক্যারিয়ারের শুরু ছিল এআই সিমুলেশন গেম ডিজাইন করা, অ্যালফা গো, অ্যালফা স্টার এবং সিমা-এর গবেষণা গেমের সাথে গভীরভাবে জড়িত, এবং ইভি হল পরবর্তী পর্যায়ের বাছাই:

আমি ফেন্রিস ক্রিয়েশন্সের সাথে কাজ করে খুশি যে এই খেলোয়াড়-তৈরি, অতুলনীয় জটিল মহাবিশ্বে নতুন গেমিং অভিজ্ঞতা অন্বেষণ করা এবং এআই গবেষণা এগিয়ে নেওয়া সম্ভব হচ্ছে।

অধিকাংশ এআই বেঞ্চমার্ক যেন একটি শারীরিক পরীক্ষা, এভি বরং এআইকে একটি ২৩ বছর ধরে চলছে কৃত্রিম সমাজের মধ্যে ফেলে দেয়।

স্মার্ট এজেন্ট 3টি সবচেয়ে কঠিন হাড়

এভি খেলোয়াড়দের দৈনিক অভ্যাস ঠিক এটাই

এই বার অফিসিয়ালভাবে তিনটি গবেষণা দিক উল্লেখ করা হয়েছে: দীর্ঘ-সময়কালের পরিকল্পনা (long-horizon planning), স্মৃতি (memory), এবং ধারাবাহিক শিক্ষা (continual learning)।

এই তিনটি দিক হল বর্তমান এআই এজেন্ট গবেষণা ক্ষেত্রে স্বীকৃত তিনটি সবচেয়ে কঠিন সমস্যা।

যদি আপনার পাশে কেউ দশ বছরের বেশি সময় ধরে EVE Online খেলে থাকে, তাকে তার অ্যাকাউন্ট খুলে বন্ধুদের তালিকা দেখাতে বলুন, আপনি খুব সম্ভবত ডজন ডজন গ্রুপ, শতাধিক নাম দেখতে পাবেন, যাদের মন্তব্যে লেখা থাকবে—“2018-এর Delve যুদ্ধের ঋণ”, “Goonswarm-এর অভ্যন্তরীণ ষড়যন্ত্রকারী, সহযোগিতা করবেন না”, “এই লোকটি গুপ্তচর, সংগঠনটি জানে”。

এটি কনটেক্সট উইন্ডো নয়, বরং দশকের শুরু থেকে শুরু হওয়া ক্রস-সেশনাল লং-টার্ম মেমোরি।

এই পর্বটি মনে রাখা, EVE খেলোয়াড়রা প্রতিদিন পার করে, অবিরাম শেখার এই পর্বটিও একইভাবে।

জানুয়ারি 2014-এ, B-R5RB যুদ্ধ প্রায় 21 ঘন্টা স্থায়ী হয়, যেখানে 7500-এরও বেশি চরিত্র অংশগ্রহণ করে এবং 75টি টাইটান ধ্বংস হয়, যার ক্ষতি প্রায় 30 লক্ষ মার্কিন ডলারের সমতুল্য। এই যুদ্ধের শুরু হয়েছিল একটি সার্বভৌম বিলের স্বয়ংক্রিয় পরিশোধ না হওয়ায়।

এই যুদ্ধের পর গেমটির সমস্ত ফ্লিট ট্যাকটিক্স পুনর্লিখিত হয়েছে। পরবর্তী কয়েক বছর ধরে সমস্ত অ্যালায়েন্সের ফ্লিট কনফিগারেশন এবং ট্যাকটিক্স সিস্টেম রিভিউ ভিত্তিক আপডেটের চারপাশে ঘুরে বেড়াচ্ছিল। প্রতি মাসেই এটি পরিবর্তন হচ্ছিল, প্রতিটি পরাজয়কে বাস্তবায়নযোগ্য স্ট্র্যাটেজি আপডেটে বিশ্লেষণ করা হচ্ছিল।

দীর্ঘমেয়াদী পরিকল্পনার ক্ষেত্রে, EVE অ্যালায়েন্স যুদ্ধের মানক সময় একক ঘন্টা নয়, বরং মাস। একটি স্টার-রেঞ্জ যুদ্ধ প্রস্তুতি থেকে শুরু করে আক্রমণ পর্যন্ত, জাহাজ নির্মাণ, পরিবহন, কূটনীতি, গোপন কার্যক্রম, বিপক্ষের গোপন কার্যক্রম বিনষ্টকরণ—শতাধিক খেলোয়াড় কোনো কাজ বণ্টনের ছাড়াই স্বয়ংসম্পূর্ণভাবে সহযোগিতা করে, একটি সাধারণ লক্ষ্যের দিকে মাসের পর মাস এগিয়ে যায়।

এই সহযোগিতা ব্যবস্থাটি ২৩ বছর ধরে খেলোয়াড়দের নিজেদের দ্বারা বিকশিত হয়েছে।

বর্তমানে এআই স্মার্ট এজেন্ট মূল্যায়নে সবচেয়ে কঠিন হিসাবে বিবেচিত তিনটি হাড় ঠিক এভি খেলোয়াড়দের দৈনন্দিন কাজ।

EVE-এ 23 বছরের খেলোয়াড়-প্ররোচিত বিকাশ একটি সর্বদা পরিবর্তনশীল, সর্বদা জটিল এবং কোনও সংক্ষিপ্ত পথ বিহীন পরিবেশ তৈরি করেছে, যা ল্যাবে কৃত্রিমভাবে সংশ্লেষণ করা সম্ভব নয়।

2025 সালের নভেম্বরে ডিপমাইন দ্বারা প্রকাশিত SIMA 2 এখন "নির্দেশ বাস্তবায়ন" থেকে "লক্ষ্য বুঝতে, যুক্তি বিকাশ করতে এবং খেলতে খেলতে শিখতে" উন্নীত হয়েছে।

গবেষণা প্রশ্নের দিক থেকে, EVE প্রকল্প এবং SIMA 2 উভয়ই «গেমকে এজেন্ট প্রশিক্ষণের মাঠ» হিসাবে বিবেচনা করে, শুধুমাত্র এবার মাঠটি ২৩ বছর ধরে চলমান একটি বাস্তব মহাবিশ্বে পরিণত হয়েছে।

ডিপমাইন্ড

ইভ অনলাইন গেমের ইন-গেম ক্যামপেইন দৃশ্য, এই ধরনের খেলোয়াড়-সংগঠিত, ঘন্টার পর ঘন্টা ধরে চলা বৃহৎ যুদ্ধগুলি হল ডিপমাইন্ডের ইভকে দীর্ঘমেয়াদি পরিকল্পনা এবং ধারাবাহিক শিক্ষার গবেষণা পরিস্থিতি হিসাবে বাছাই করার মূল কারণ।

ডিপমাইন্ড অফলাইন স্যান্ডবক্সে প্রবেশ করেছে

নয় প্লেয়ার ইউনিভার্স

ডিপমাইন্ড এবং ফেন্রিসের এই সহযোগিতা কল্পনার চেয়ে সাবধানে পরিচালিত হয়েছে, ডিপমাইন্ডকে বর্তমান খেলোয়াড়দের প্রোডাকশন সার্ভারে সরাসরি অ্যাক্সেসের অনুমতি দেওয়া হয়নি।

DeepMind অফিসিয়াল বিজ্ঞপ্তিতে ঘোষণা করেছে: প্রাথমিক গবেষণা অফলাইন সংস্করণে EVE Online-এ পরিচালিত হবে, স্থানীয় সার্ভার ব্যবহার করে, নিয়ন্ত্রিত পরিবেশে মডেল পরীক্ষা এবং মূল্যায়ন করা হবে, এবং এটি EVE Online-এর অপারেশনাল সার্ভারের সাথে সংযুক্ত হবে না।

একদিকে, অফলাইন সংস্করণ অর্থ হল যে DeepMind বর্তমান খেলোয়াড়দের ম্যাচ ডেটা ব্যবহার করবে না এবং বাস্তব সার্ভার অর্থনীতিকে বিঘ্নিত করবে না, যা কোনও গোপনীয়তা বা সঙ্গতির জটিলতা এড়ায়।

অন্যদিকে, অফলাইন সংস্করণে EVE এখনও জটিল নিয়ম সিস্টেম, জাহাজ এবং অর্থনীতির ব্যবস্থা, স্টার রিজিয়ন স্ট্রাকচার ইত্যাদি মূল ডিজাইন বজায় রাখতে পারে।

ডিপমাইন্ড পেয়েছে একটি "২৩ বছরের খেলোয়াড়দের দ্বারা পরীক্ষিত" জটিল বিশ্ব, যেখানে এজেন্টকে বেঁচে থাকতে হবে।

অ্যাটারি থেকে ইভি

এই পথটি কোথায় নিয়ে যায়

ডিপমাইন্ডের এই দশকগুলির প্রশিক্ষণ মাঠ থেকে পিছনে ফিরে তাকালে, একটি খুব স্পষ্ট বিকাশের রেখা দেখা যায়।

2013 থেকে 2015 এর মধ্যে, Atari ছিল শুরু। DQN এজেন্টকে ব্রিক ব্রেকার, স্পেস ইনভেডার্স এর মতো স্পষ্ট লেভেল এবং বন্ধ নিয়মের গেমে রাখে। এখানে প্রতিক্রিয়া এবং মূল্য অনুমানের পরীক্ষা করা হয়।

২০১৬ থেকে ২০১৭ সালে, আলফা গো এবং আলফা জিরো। গো খেলার নিয়ম সুসংগঠিত, ক্রিয়ার স্পেস বিশাল কিন্তু বন্ধ। এটি অনুসন্ধান এবং দীর্ঘ শৃঙ্খল যুক্তির উপর নির্ভর করে।

২০১৯ সালে, আলফাস্টার স্টারক্রাফ্ট ২-এ প্রবেশ করে। এটি ছিল প্রথমবারের মতো রিয়েল-টাইম, অপূর্ণ তথ্য, একাধিক লাইনের গেমপ্লের পরিবেশে। এটি আংশিকভাবে পর্যবেক্ষণযোগ্য পরিস্থিতিতে রিয়েল-টাইম সিদ্ধান্ত নেওয়ার উপর পরীক্ষা করেছিল।

২০২৪ সালে, SIMA একাধিক গেমের মধ্যে সাধারণ বুদ্ধিমত্তা তৈরি করতে চায়। এটি স্থানান্তর সাধারণীকরণকে পরীক্ষা করে।

2025 সালে, SIMA 2 আপগ্রেড: শুধু নির্দেশ পালন করা নয়, বরং ব্যবহারকারীদের সাথে কথা বলা, লক্ষ্য যুক্তিসঙ্গতভাবে বিশ্লেষণ করা এবং গেমপ্লে প্রক্রিয়ায় নিজেকে উন্নত করা।

ডিপমাইন্ড

2025 সালে ডিপমাইন দ্বারা প্রকাশিত SIMA 2, এখন "নির্দেশ বাস্তবায়ন" থেকে "লক্ষ্য বুঝতে, যুক্তি প্রয়োগ করতে এবং খেলার সময় শিখতে" উন্নীত হয়েছে

প্রতিটি প্রজন্মের পরিবেশে আগের প্রজন্মের তুলনায় কিছুটা “বাস্তব জগতের চেহারা” যোগ হয়েছে: নিয়মের বন্ধ থেকে নিয়মের খোলা, পারফেক্ট ইনফরমেশন থেকে ইমপারফেক্ট ইনফরমেশন, একক ম্যাচের প্রতিদ্বন্দ্বিতা থেকে ম্যাচের মধ্যে স্থানান্তর।

কিন্তু এর আগে এই পরিস্থিতিগুলি বেশিরভাগই আপেক্ষিকভাবে বন্ধ, বিভাজ্য এবং পুনরাবৃত্তিযোগ্য মূল্যায়নের ক্ষেত্র ছিল, যেমন: অ্যাটারি হল স্থির নিয়মের আর্কেড গেম, অ্যালফাস্টার একটি একটি করে শেষ হওয়া স্টারক্রাফট লড়াইয়ের সম্মুখীন হয়েছিল, আর SIMA বিভিন্ন 3D ভার্চুয়াল পরিবেশে গেমের মধ্যে সাধারণীকরণ পরীক্ষা করেছে।

EVE-এর বিশেষত্ব হল এটি একটি দীর্ঘমেয়াদী, খেলোয়াড়-পরিচালিত, যেখানে অর্থনীতি এবং রাজনৈতিক কাঠামো ধারাবাহিকভাবে বিকশিত হয়।

এটি 23 বছর ধরে একটি খোলা নিয়মের বিশ্বে বাস্তব খেলোয়াড়দের দ্বারা স্বয়ংসঞ্চালিতভাবে বিকশিত হয়েছে: পূর্ণাঙ্গ খেলোয়াড়-প্রেরিত অর্থনীতি (ISK মূল্যের দোলন বাস্তব আর্থিক বাজারের মতো), কোয়ার্টার-পারস্পরিক রাজনৈতিক কাঠামো (কূটনীতি, গুপ্তচরবৃত্তি, যুদ্ধবিরতি চুক্তি), ছোট সংঘর্ষ থেকে 21 ঘন্টার যুদ্ধ পর্যন্ত সম্পূর্ণ যুদ্ধ ইকোসিস্টেম।

বিশেষজ্ঞদের মধ্যে বুদ্ধিমান এজেন্ট মূল্যায়নের জন্য একটি স্পষ্ট সমঝোতা গড়ে উঠছে, একক কাজের স্কোরিং এখন আর কোনও নতুন জিনিস দেখাতে পারছে না, কিন্তু দীর্ঘমেয়াদি মেমোরি, সপ্তাহের পরিকল্পনা এবং ব্যর্থতা থেকে শেখা—এগুলির জন্য এখনও কোনও উপযুক্ত মূল্যায়ন পরিবেশ নেই।

সুতরাং, DeepMind এবারের পছন্দ হল: একটি নতুন সিনথেটিক পরিবেশ তৈরির পরিবর্তে, একটি এমন মানব-তৈরি সমাজের দিকে যা ২৩ বছর ধরে মানুষের খেলার মাধ্যমে পরীক্ষিত হয়েছে।

কিন্তু বড় সমস্যাগুলি এখন উঠে এসেছে:

একটি এভি তে স্থায়ীভাবে বিদ্যমান থাকা, অবিরত শিক্ষা নেওয়া এবং অবিরত পরিকল্পনা করা একটি এআই এজেন্টের সাথে বাস্তব বিশ্বে স্বাধীনভাবে কার্যকরী এজেন্টের মধ্যে কী পার্থক্য রয়েছে?

প্রসঙ্গ:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

এই লেখাটি ওয়েইচ্যাট গ্রুপ "নিউ জিয়েয়ুয়ান" থেকে এসেছে, লেখক: ASI প্রতিজ্ঞা, সম্পাদক: ইউয়ুয়ান