ڈیپ مائنڈ نے 23 سالہ ورچوئل یونیورس میں AI کا ٹیسٹ کرنے کے لیے EVE Online کے ساتھ شراکت کی ہے

ڈیپ مائن کے سی ای او اور الفاگو کے موجد دیمیس ہیسابس نے AI تحقیق کے لیے کھیلوں کا استعمال کرنا شروع کر دیا ہے، جو اب تک دس سال سے زیادہ کا عرصہ ہو چکا ہے۔

اس بار، اس نے AI کو ایک ایسے اسپیس نیٹ ورک گیم، EVE Online میں ڈال دیا جو 23 سال سے چل رہا ہے اور جس کا نئے صارفین کے لیے گائیڈ بھی کھلاڑیوں کو بھاگنے پر مجبور کر دے۔

شطرنج کا خاتمہ ہوتا ہے، لیکن EVE کا نہیں۔

مئی کے آغاز میں، ڈیپ مائنڈ نے EVE Online کے ساتھ تحقیقی تعاون کا اعلان کیا، کیونکہ EVE کا پیچیدہ اور صارفین کے ذریعہ چلائے جانے والے کائنات، AI کی یادداشت، مستقل سیکھنے اور طویل مدتی منصوبہ بندی کے لیے ایک مثالی محفوظ سینے ہے۔

ڈیپ مائنڈ

ڈیپ مائنڈ نے EVE کے ساتھ شراکت نہیں کی ہے تاکہ دلچسپ گیم کا تجربہ حاصل کیا جا سکے، یا گیم پلے کو طاقت دیا جا سکے، بلکہ اس کا مقصد AI ایجینٹ تحقیق کے ان تین مشہور سب سے مشکل چیلنجز کو حل کرنا ہے، جس کا جواب ہاساس نے ایک 23 سال پرانے گیم پر لگا دیا۔

ڈیپ مائنڈ

فینریس کریشنز (سابقہ CCP Games) نے ڈیپ مائنڈ کے ساتھ تعاون کا اعلان کیا ہے

EVE Online کے پیچھے کی کمپنی نے 6 مئی کو ایک ہی دن چار باتیں اعلان کیں:

ماں کمپنی Pearl Abyss کے نظام سے دوبارہ مستقل ہو گیا؛
فینریس کریشنز کے نام سے جانا جائے گا؛
120 ملین امریکی ڈالر کا ٹریڈ مکمل کیا گیا؛
گوگل نے اس مستقل حصے کے طور پر فینریس کریشنز کا کچھ حصہ رکھا ہے اور گوگل ڈیپ مائنڈ کے ساتھ تحقیقی تعاون شروع کیا ہے۔

فینریس کریشنز کے سی ای او ہلمار ویگار پیٹرسن نے اعلان میں کہا:

اس تبدیلی میں ملازمین کو بے کار نہیں کیا جائے گا اور کوئی دوبارہ تنظیم نہیں ہوگی، ٹیم، پروڈکٹ اور ڈویلپمنٹ منصوبے ویسے ہی رہیں گے۔ EVE جاری رہے گا۔

آپریشنل ڈیٹا کے مطابق، یہ کمپنی معاہدے پر بات چیت کرنے کے لیے "حقیقی اسلحہ" لے کر آئی ہے، نہ کہ زندہ بچنے کے لیے اثاثے بیچ رہی ہے۔

ای وی آن لائن نے 2025ء میں 70 ملین امریکی ڈالر سے زیادہ کمانے کا ریکارڈ قائم کیا، نومبر میں تاریخی سب سے زیادہ آمدنی کا ریکارڈ توڑا، اور چوتھا تِینہ مہینہ اس گیم کی 20 سالہ تاریخ میں دوسرے سب سے زیادہ کمائی والے تِینہ مہینے بن گیا۔

فینریس کریشنز کا الگ ہونا اس بات کا مطلب ہے کہ ایوی کے پاس اب ایک ایسا مالک ہے جو تحقیقی تعاون کے فیصلوں کو خود طے کر سکتا ہے، اور جو بڑی گیم جاری کرنے والی کمپنی کے سٹریٹجک مقاصد سے مربوط نہیں ہے۔

ڈیپ مائنڈ

1997 میں فینریس نے جاری کیا گیا ٹیبل گیم پروڈکٹ باکس۔ "فینریس" نام EVE Online سے 6 سال پہلے سے موجود تھا، فینریس کریشنز کے نام تبدیل کرنا ایک واپسی ہے، نہ کہ نیا آغاز

ڈیپ مائنڈ نے EVE کو کیوں چنا؟

2023 کا "مصنوعی معاشرہ"

AI بینچ مارک کو دوبارہ نہیں بنایا جا سکتا

بہت سے لوگ "گیم + AI تحقیق" سن کر پہلی بار ایلفاگو یا ایلفااسٹار، ای وی کو یاد کرتے ہیں، لیکن ان سب سے مختلف ہیں۔

کھیل گو اور سٹارکرافٹ میں ایک مشترکہ خصوصیت یہ ہے کہ ایک میچ کا آغاز ہوتا ہے، ختم ہوتا ہے، اور اس میں واضح جیت یا ہار کے قواعد ہوتے ہیں۔

الفاؤگو کا مقصد شطرنج کھیل جیتنا ہے، الفاسٹار کا مقصد اسٹارکرافٹ کا معرکہ جیتنا ہے، دونوں «ایکل جیسی ذہانت» کے تحقیقی ماڈل ہیں، لیکن EVE کا کوئی اختتام نہیں ہے۔

EVE Online کو "ایک مشترکہ یونیورس" (single-shard / single shared universe) کے لیے جانا جاتا ہے، جہاں بڑی تعداد میں کھلاڑی ایک مستقل دنیا میں طویل عرصے تک مقابلہ، تجارت، اتحاد اور جنگ کرتے ہیں۔

کھلاڑیوں نے یہاں اصلی معاشی نظام، سیاسی اتحاد، فوجی گروہ، تجارتی راستے، تاریخی دشمنیاں اور سالوں پر مشتمل جنگی منصوبے بنائے ہیں۔

کچھ جنگیں تیاری سے لے کر ختم ہونے تک پورا ایک سال لے لیتی ہیں۔ کچھ اتحادوں کا ابھار اور پتہ ہونا بعد کے کھلاڑیوں کے لیے حقیقی تاریخ کے طور پر تحقیق کا موضوع بن جاتا ہے۔

ہلمار نے اعلان میں کہا: "EVE ایک ایسا کم تعداد کا مقام ہے جہاں آپ ایسے ماحول میں ذہنی مسائل کا جائزہ لے سکتے ہیں جو اصل دنیا کی طرح کام کرتا ہے۔"

ہاسابس نے مزید کہا کہ وہ بچپن سے گیمز کھیلتے تھے، اور اپنی کیریئر کا آغاز AI سیمیولیشن گیم ڈیزائن کرکے کیا، جس میں AlphaGo، AlphaStar اور SIMA کے تحقیقی اقدامات گیم سے گہرائی سے جڑے ہوئے ہیں، اور EVE اگلے مرحلے کا انتخاب ہے:

میں فینریس کری ایشنز کے ساتھ تعاون کر کے بہت خوش ہوں، جہاں ہم کھلاڑیوں کے ذریعہ بنائے گئے، بے مثال طور پر پیچیدہ یونیورس میں نئے گیمنگ تجربات کا محفوظ طریقے سے جائزہ لیں گے اور AI تحقیق کو آگے بڑھائیں گے۔

زیادہ تر AI بینچ مارکس جیسے صحت کے جانچ کے ہیں، EVE زیادہ تر AI کو ایک ایسے "مصنوعی معاشرے" میں ڈال دیتا ہے جو 23 سال سے جاری ہے۔

ایجنٹ 3 کی سب سے مشکل تین ہڈیاں

بالکل EVE کھلاڑیوں کا روزمرہ کا معمول

اس مرتبہ، افسران نے تین تحقیقی شعبوں کو واضح طور پر فہرست کیا ہے: لمبے عرصے کی منصوبہ بندی (long-horizon planning)، یادداشت (memory)، اور مستقل سیکھنا (continual learning)۔

یہ تین راستے، AI ایجینٹ تحقیق کے شعبے میں موجودہ وقت میں تسلیم شدہ تین سب سے مشکل چیلنجز ہیں۔

اگر آپ کے قریب کوئی ایسا شخص ہے جس نے دس سال سے زیادہ عرصہ تک EVE Online کھیلا ہو، تو اسے اپنا اکاؤنٹ کھول کر دوستوں کی فہرست دکھانے کو کہیں، آپ بہت احتمال ہے کہ دسیوں گروپ، سو سے زیادہ نام دیکھیں گے، جن کے نوٹس میں لکھا ہوگا: "2018 کے Delve مہم میں قرض"، "鹅群联盟 (Goonswarm) کا اندر کا خائن، تعاون نہ کریں"، "یہ آدمی جاسوس ہے، اس کے بارے میں پوری تنظیم جانتی ہے"۔

یہ کنٹیکسٹ ونڈو نہیں بلکہ سیشن کے درمیان دس سال کی لمبی یادداشت ہے۔

یہ میموری کا ٹیسٹ، EVE کھلاڑی ہر روز پاس کرتے ہیں، اور مستقل سیکھنے کا ٹیسٹ بھی اسی طرح ہے۔

جنوری 2014 میں، B-R5RB کی لڑائی تقریباً 21 گھنٹے تک جاری رہی، جس میں 7500 سے زائد کردار شامل تھے، 75 ٹائٹن تباہ ہو گئے، اور نقصان کا تخمینہ تقریباً 300,000 امریکی ڈالر کے برابر تھا۔ پوری لڑائی کا سبب ایک س sovereignty بِل کا خودکار ادائیگی نہ ہونا تھا۔

اس جنگ کے بعد، پورے گیم کی فلیٹ تکنیک مکمل طور پر تبدیل ہو گئی۔ اگلے کچھ سالوں تک، تمام اتحادوں نے اپنی فلیٹ ترتیب اور تکنیکی نظام کو جائزہ لینے کے بنیاد پر ترقی دی۔ ہر ماہ میں تبدیلیاں ہوتی رہیں، اور ہر شکست کو قابل عمل حکمت عملی میں تبدیل کر دیا گیا۔

لمکن منصوبہ بندی کے لیے، EVE گروہ کے جنگ کا معیاری وقت کا اکائی گھنٹہ نہیں، بلکہ ماہ ہے۔ ایک سیارے کے درمیان جنگ کو تیار کرنے سے لے کر شروع تک، جہاز بنانے، نقل و حمل، دیپلومیسی، چھپنے، اور جاسوسی کے خلاف، سو سے زائد کھلاڑی بغیر کسی ٹاسک سکیولنگ کے خودبخود مل کر کام کرتے ہیں اور ایک مشترکہ مقصد کو ماہوں تک آگے بڑھاتے ہیں۔

یہ تعاونی نظام 23 سالوں میں کھلاڑیوں نے خود اپنا لیا۔

موجودہ AI ایجینٹ ایوان میں سب سے سخت تین ہڈیاں، جو EVE کھلاڑیوں کی روزمرہ کی زندگی ہیں۔

EVE میں 23 سال کے کھلاڑیوں کے ذریعہ ترقی پذیر تبدیلیوں نے ایک ایسا ماحول پیدا کیا جو مستقل طور پر تبدیل ہوتا رہتا ہے، مستقل طور پر پیچیدہ ہے، اور جس کے لیے کوئی جلدی راستہ نہیں ہے—یہ پیچیدگی لیب میں تخلیقی طور پر حاصل نہیں کی جا سکتی۔

2025ء کے نومبر میں ڈیپ مائنڈ نے SIMA 2 جاری کیا، جو "ہدایات کی انجام دہی" سے آگے بڑھ کر "مقصد کو سمجھنا، استدلال کرنا، اور کھیلتے ہوئے سیکھنا" تک پہنچ گیا ہے۔

تحقیقی سوال کے لحاظ سے، EVE پروجیکٹ SIMA 2 کے ساتھ "گیم کو ایجنٹ ٹریننگ فیلڈ" کے راستے میں شامل ہے، صرف اس فرق کے ساتھ کہ اب یہ میدان ایک ایسا حقیقی یونیورس ہے جو 23 سالوں تک جاری رہا ہے۔

ڈیپ مائنڈ

EVE Online کے گیم میں کیمپین کے مناظر، جن میں صارفین کی طرف سے خودبخود منظم کیے جانے والے، کئی گھنٹوں تک جاری رہنے والے بڑے جنگی میدان، DeepMind کے لیے EVE کو لمبے مدتی منصوبہ بندی اور مستقل سیکھنے کے تحقیقی ماحول کے طور پر منتخب کرنے کا بنیادی سبب ہیں۔

ڈیپ مائنڈ آف لائن سینڈ باکس میں جاتا ہے

نہیں کھلاڑی یونیورس

ڈیپ مائنڈ کی طرف سے فینریس کے ساتھ اس بار کا تعاون، تصور سے زیادہ محتاط ہے، ڈیپ مائنڈ کو موجودہ کھلاڑیوں کے سرور میں فوری رسائی نہیں ملی ہے۔

ڈیپ مائنڈ کی طرف سے جاری اعلان میں کہا گیا ہے کہ ابتدائی تحقیق EVE Online کے آفلائن ورژن پر مقامی سرور کے ذریعے کی جائے گی، جہاں ماڈل کو کنٹرولڈ ماحول میں ٹیسٹ اور جانچا جائے گا اور یہ EVE Online کے آفیشل سرور سے منسلک نہیں ہوگا۔

ایک طرف، آف لائن ورژن کا مطلب ہے کہ DeepMind موجودہ کھلاڑیوں کے میچ کے ڈیٹا کا استعمال نہیں کرے گا اور اصل سرور کی معیشت کو متاثر نہیں کرے گا، جس سے کسی بھی خصوصیات اور مطابقت کے پیچیدہ مسائل سے بچا جا سکتا ہے۔

دوسری طرف، آف لائن ورژن EVE اب بھی پیچیدہ قوانین کے نظام، جہاز اور مالیاتی مکینزمز، اور ستارہ جاتی ساخت جیسے مرکزی ڈیزائنز کو برقرار رکھ سکتی ہے۔

ڈیپ مائنڈ کو ایک ایسا پیچیدہ عالم ملا ہے جسے 23 سال کے کھلاڑیوں نے ٹیسٹ کر لیا ہے، جہاں ایجنٹ کو زندہ رہنا ہے۔

اتاری سے لے کر EVE تک

یہ راستہ کہاں جاتا ہے؟

گہرے مائنڈ کے اس دہائیوں کے تربیتی میدان سے پیچھے کی طرف دیکھتے ہوئے، ایک بہت واضح ترقی کی کہانی نظر آتی ہے۔

2013 سے 2015 تک، Atari شروعات تھی۔ DQN نے ایجینٹ کو "بلاک ٹوڈر" اور "اسپیس انسورژرز" جیسے واضح لیولز اور بند قوانین والے کھیلوں میں ڈال دیا۔ اس میں ری ایکشن اور ویلیو ایسٹیمیشن کا امتحان لیا گیا۔

2016 سے 2017 تک، AlphaGo اور AlphaZero۔ گو کے قوانین منظم، ایکشن اسپیس بہت بڑا لیکن بند ہے۔ یہ تلاش اور لمبی زنجیر کی استدلال کا امتحان ہے۔

2019 میں، AlphaStar نے سٹارکرافٹ II میں قدم رکھا۔ یہ پہلی بار تھا جب اس نے ریل ٹائم، نا مکمل معلومات، اور متعدد لائن کے گیم کے ماحول میں قدم رکھا۔ اس کا امتحان جزوی طور پر قابل مشاہدہ حالات میں ریل ٹائم فیصلہ سازی پر تھا۔

2024 میں، SIMA کا مقصد متعدد گیمز میں ایک جنرلائزڈ ایجنٹ بنانا تھا، جس کا اہداف تبدیلی اور عام کرنا تھا۔

2025ء میں، SIMA 2 اپ گریڈ: صرف حکمات کا انجام نہیں دے رہا، بلکہ صارفین کے ساتھ بات چیت کر رہا ہے، مقاصد کا استدلال کر رہا ہے، اور گیم کے دوران خود کو بہتر بنارہا ہے۔

ڈیپ مائنڈ

ڈیپ مائنڈ نے 2025 میں SIMA 2 جاری کیا، جو "ہدایات کی انجام دہی" سے "مقصد کو سمجھنا، استدلال کرنا، اور کھیلتے ہوئے سیکھنا" تک ترقی کر چکا ہے

ہر نسل کا ماحول اپنے سے پہلے والی نسل کے مقابلے میں "حقیقی دنیا کی شکل" کچھ زیادہ شامل کرتا ہے: قوانین کے بند ہونے سے لے کر قوانین کے کھل جانے تک، مکمل معلومات سے لے کر ناقص معلومات تک، ایکل مقابلے سے لے کر متعدد مقابلہ جات میں منتقلی تک۔

لیکن پہلے، یہ ماحول زیادہ تر نسبتاً بند، تقسیم کیے جانے والے، اور دوبارہ جانچے جانے والے کام کے میدان تھے، جیسے Atari میں فکسڈ قواعد والے آرکیڈ گیمز تھے، AlphaStar نے ایک ایک کرکے ختم ہونے والے اسٹارکرافٹ مقابلے کا مقابلہ کیا، اور SIMA نے متعدد 3D ورچوئل ماحولوں میں گیمز کے درمیان جامعیت کا امتحان لیا۔

EVE کی خاص بات یہ ہے کہ یہ ایک لمبے عرصے تک چلنے والا، کھلاڑیوں کے ذریعہ چلایا جانے والا، اور اقتصادی اور سیاسی ڈھانچوں کے مستقل ترقی پذیر ماحول ہے۔

یہ 23 سالوں میں، ایک کھلے قوانین والے دنیا میں حقیقی کھلاڑیوں کی طرف سے خودبخود ترقی کر چکا ہے: مکمل کھلاڑی چلائی گئی معیشت (ISK کی قیمت میں لہجہ حقیقی مالیاتی بازاروں جیسا ہے)، عبوری اتحادوں کی سیاسی ساخت (دیپلومسی، جاسوسی، جنگ بندی کے معاہدے)، اور چھوٹے تنازعات سے لے کر 21 گھنٹے تک جاری جنگ تک کا مکمل جنگی ا生态۔

اندرونی دنیا میں ایجنٹس کے جائزے کے لیے ایک واضح اتفاق رائے ہوتا جا رہا ہے، اکیلے کاموں کے اسکور کرنا اب کوئی نیا انداز نہیں رہا، لیکن لمبی مدتی یادداشت، ہفتہ وار منصوبہ بندی، اور ناکامی سے سیکھنا، اب تک کوئی مناسب جائزہ ٹیسٹنگ ماحول نہیں تھا۔

اس لیے، DeepMind کا اس بار کا انتخاب یہ ہے کہ وہ ایک نیا مصنوعی ماحول بنانے کے بجائے، ایک ایسے "مصنوعی معاشرے" میں داخل ہو جائے جسے انسانی کھلاڑیوں نے 23 سال تک ٹیسٹ کر چکے ہیں۔

لیکن بڑا مسئلہ بھی سامنے آیا:

ایک ایسا AI ایجینٹ جو EVE میں مستقل طور پر موجود، مستقل سیکھے اور مستقل منصوبہ بندی کرے، اس کے اور حقیقی دنیا میں خود مختار طور پر کام کرنے والے ایجینٹ کے درمیان کیا فرق ہے؟

حوالہ جات:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

یہ مضمون ویچن گروپ "نیوزی یوان" سے ہے، مصنف: ASI کا وحی، ایڈیٹر: یوان