ڈیمیس ہاسابس پر AGI کا ٹائم لائن، سائنسی کامیابیاں، اور DeepMind کا مستقبل

ترتیب اور ترجمہ: شن چاؤ ٹیک فلو

مہمان: ڈیمیس ہاسابس (ڈیپ مائن کے بانی، 2024 کے نوبل انعام برائے کیمسٹری کے حاصل کنندہ، گوگل ڈیپ مائن کے سربراہ)

میزبان: گری ٹن

پاڈکاسٹ سرچ: Y Combinator

ڈیمس ہاسابس: ایجینٹس، AGI اور اگلی بڑی سائنسی کامیابی

اسٹریمنگ کا وقت: 29 اپریل، 2026

سرخی کو ایڈٹ کریں

گوگل ڈیپ مائنڈ کے سی ای او اور نوبل انعام یافتہ کیمیسٹ ڈیمس ہیسابس نے وائی کامبنیٹر میں شرکت کرتے ہوئے AGI تک پہنچنے کے لیے کن اہم ترقیات درکار ہیں، کاروباری افراد کو کس طرح اپنی قیادت برقرار رکھنے کی تجویز دینے اور اگلے بڑے سائنسی دریافت کہاں ہو سکتا ہے، اس بارے میں بات کی۔ گہری ٹیکنالوجی کے کاروباری افراد کے لیے سب سے زیادہ عملی جائزہ یہ ہے کہ اگر آپ آج ایک دس سالہ گہری ٹیکنالوجی پروجیکٹ شروع کر رہے ہیں، تو آپ کو AGI کے ظہور کو اپنے منصوبے میں شامل کرنا ہوگا۔ اس کے علاوہ، انہوں نے اس بات کا انکشاف بھی کیا کہ آئسومورفک لیبز (ڈیپ مائنڈ سے الگ ہونے والی AI فارماسیوٹکل کمپنی) جلد ہی ایک بڑا اعلان کرے گی۔

بہترین اقتباسات

AGI راستہ اور وقت کی تفصیل

موجودہ ٹیکنالوجی کے یہ اجزاء تقریباً یقینی طور پر AGI کے آخری ڈھانچے کا حصہ بن جائیں گے۔
"مستقل سیکھنا، لمبے عرصے تک استدلال، اور یادداشت کے کچھ پہلوؤں کے مسائل ابھی حل نہیں ہوئے، AGI کو ان سب کو حل کرنا ہوگا۔"
اگر آپ کا AGI ٹائم لائن میرے جیسا کہ تقریباً 2030 ہے، اور آپ آج ایک گہری ٹیکنالوجی پروجیکٹ شروع کر رہے ہیں، تو آپ کو یہ سوچنا ہوگا کہ AGI راستے میں ظاہر ہو جائے گا۔

یادداشت اور سیاق و سباق کا ونڈو

کنٹیکس ونڈو تقریباً کام کی یادداشت کے برابر ہے۔ انسانی کام کی یادداشت میں عام طور پر صرف سات اعداد ہوتے ہیں، جبکہ ہمارے پاس ملین یا کروڑ ٹوکن کا کنٹیکس ونڈو ہے۔ لیکن مسئلہ یہ ہے کہ ہم اس میں سب کچھ ڈال دیتے ہیں، جس میں غیر ضروری اور غلط معلومات بھی شامل ہیں، اور اب تک یہ طریقہ کافی خشن ہے۔
اگر آپ ریل ٹائم ویڈیو اسٹریم کو معالجہ کرنا چاہتے ہیں اور تمام ٹوکنز کو محفوظ کرنا چاہتے ہیں، تو ایک ملین ٹوکن صرف تقریباً 20 منٹ کے لیے کافی ہیں۔

استدلال کی کمی

میں جیمینی کے ساتھ شطرنج کھیلتا ہوں۔ کبھی کبھی یہ ایک بری حرکت ہونے کا احساس کرتا ہے، لیکن بہتر کوئی راستہ نہیں ڈھونڈ پاتا، اور ایک چکر لگانے کے بعد بھی وہی بری حرکت کر دیتا ہے۔ لیکن ایک درست استدلالی نظام میں ایسا نہیں ہونا چاہئے۔
یہ ایک طرف IMO کے سونے کے تمغہ والے سوالات حل کر سکتا ہے، دوسری طرف اگر سوال کو مختلف انداز میں پوچھا جائے تو یہ ابتدائی ریاضی کی غلطیاں کر دیتا ہے۔ اپنے خود کو سوچنے کے عمل پر عکس کرنے میں، اس میں کچھ کمی لگتی ہے۔

ایجنٹ اور خلاقیت

AGI تک پہنچنے کے لیے، آپ کو ایک�یسیستم چاہیے جو آپ کے لیے فعال طور پر مسائل حل کرے۔ ایجنٹ وہ راستہ ہے، اور مجھے لگتا ہے کہ ہم صرف شروع ہوئے ہیں۔
میں نے اب تک کوئی 3A گیم نہیں دیکھی جو vibe coding کے ذریعے بنائی گئی ہو اور اسٹور کی ٹاپ چارٹ پر پہنچی ہو۔ موجودہ محنت کے لحاظ سے یہ ممکن ہونا چاہیے، لیکن اب تک نہیں ہوا۔ اس سے ظاہر ہوتا ہے کہ ٹولز یا عمل میں کچھ کمی ہے۔

ڈسٹیلیشن اور چھوٹے ماڈل

ہمارا فرض یہ ہے کہ ایک جدید Pro ماڈل کے شروع ہونے کے ستھرے سے ایک سال کے اندر، اس کی صلاحیتیں بہت چھوٹے، کنارے کے ڈیوائسز پر چلنے والے ماڈل میں دب دی جائیں گی۔ اب تک تھیوریٹیکل اطلاعات کی ڈینسٹی کی حد تک نہیں پہنچا گیا ہے۔

سائنسی دریافتوں اور "آئن سٹائن ٹیسٹ"

میں اسے کبھی کبھی "ائناسٹائن ٹیسٹ" کہتا ہوں، یعنی کیا 1901 کے علم کے ساتھ ایک سسٹم کو تربیت دی جا سکتی ہے اور پھر اسے خود سے اینسٹائن کے 1905 کے نتائج، جیسے خاص نسبیت، استنباط کرنے دیا جا سکتا ہے۔ ایک بار جب یہ ممکن ہو جائے، تو یہ سسٹم بالکل نئی چیزوں کی ایجاد کے قریب ہو جائیں گے۔
ایک ہزار سالہ انعام کا مسئلہ حل کرنا بہت بڑی بات ہے۔ لیکن اس سے زیادہ مشکل یہ ہے کہ کیا آپ نئے ہزار سالہ انعام کے مسائل کا ایک مجموعہ پیش کر سکتے ہیں، جو عالِمِ ریاضیات کے لیے اتنے ہی گہرے اور اتنے ہی قابلِ تحقیق ہوں؟

ڈیپ ٹیک اسٹارٹ اپ کے مشورے

مشکل سوالات اور آسان سوالات میں اصل میں کوئی فرق نہیں، صرف مشکل ہونے کا انداز مختلف ہے۔ زندگی بہت لمبی نہیں، اس لیے اپنی توانائی اس بات پر مرکوز کریں جو آپ نہ کریں تو کوئی اور نہیں کرے گا۔

AGI کا راستہ

گری ٹن: آپ نے AGI پر دوسرے تمام لوگوں کے مقابلے میں زیادہ وقت تک سوچا ہے۔ موجودہ پیراڈائیم کو دیکھتے ہوئے، آپ کے خیال میں ہم نے AGI کی آخری ساخت کا کتنا حصہ حاصل کر لیا ہے؟ اب تک بنیادی طور پر کیا کم ہے؟

ڈیمیس ہساسیس: بڑے پیمانے پر پری ٹرینڈ، RLHF، اور سوچ کے سلسلے جیسی چیزیں، میں بہت مطمئن ہوں کہ وہ AGI کے آخری ڈھانچے کا حصہ بنیں گی۔ ان ٹیکنالوجیز نے آج تک بہت کچھ ثابت کر دیا ہے۔ میں اس بات کا تخیل بھی نہیں کر سکتا کہ دو سال بعد ہم پائیں گے کہ یہ راستہ موت کا ہے، یہ میرے لیے منطقی نہیں لگتا۔ لیکن موجودہ چیزوں کے علاوہ، شاید ابھی ایک یا دو چیزیں باقی ہیں۔ مستقل سیکھنا (continual learning)، لمبے عرصے تک استدلال (long-term reasoning)، اور یادداشت کے کچھ پہلوؤں کے مسائل ابھی حل نہیں ہوئے۔ AGI کو ان سب کو حل کرنا ہوگا۔ شاید موجودہ ٹیکنالوجی میں تدریجی ابتریاں شامل کرکے اس تک پہنچا جا سکتا ہے، لیکن شاید ابھی ایک یا دو بڑے اہم نکات باقی ہیں جن پر عمل درآمد کرنا ضروری ہے۔ مجھے لگتا ہے کہ یہ ایک یا دو سے زائد نہیں ہوں گے۔ میرا ذاتی جائزہ ہے کہ اس قسم کے حل نہ ہونے والے اہم نکات کا امکان تقریباً 50-50 ہے۔ اس لیے Google DeepMind میں، ہم دونوں راستوں پر کام جاری رکھ رہے ہیں۔

گری ٹن: میں نے کئی ایجینٹ سسٹمز کے ساتھ کام کیا ہے، اور جو مجھے سب سے زیادہ حیران کرتا ہے وہ یہ ہے کہ بنیادی طور پر وہی وزن بار بار استعمال ہو رہے ہیں۔ اس لیے مستقل سیکھنے کا تصور خاص طور پر دلچسپ ہے، کیونکہ اب ہم تقریباً صرف ٹیپ کے ذریعے چیزوں کو جوڑ رہے ہیں، جیسے وہ "رات کے خوابوں کے دور" وغیرہ۔

ڈیمیس ہاسابس: ہاں، وہ خواب کے دورانہ بہت دلچسپ ہیں۔ ہم نے پہلے بھی حوالہ کی یادداشت کے ادغام پر سوچا تھا۔ میری ڈاکٹری تحقیق ہپوکیمپس کے بارے میں تھی کہ وہ نئے علم کو موجودہ علم کے نظام میں کیسے ایک نرمی سے شامل کرتا ہے۔ دماغ اس معاملے میں بہت بہترین کام کرتا ہے۔ وہ اس عمل کو نیند کے دوران، خاص طور پر REM نیند (REM sleep) کے دوران، اہم تجربات کو دوبارہ پلٹ کر سیکھنے کے لیے مکمل کرتا ہے۔ ہمارا پہلا Atari پروگرام DQN (DeepMind کا 2013ء میں شائع کردہ ڈیپ قیمت نیٹ ورک، جس نے Atari کھیلوں میں گہری تقویت سیکھنے کے ذریعے انسانی سطح تک پہنچنا شروع کیا) Atari کھیلوں کو سمجھنے کا ایک اہم طریقہ تجربہ کا دوبارہ جائزہ لینا (experience replay) تھا۔ یہ نیورو سائنس سے سیکھا گیا تھا، جس میں کامیاب راستوں کو دوبارہ دوبارہ پلٹا جاتا تھا۔ یہ 2013ء کا واقعہ تھا، جو AI دنیا میں قدیم دور کا مانا جاتا ہے، لیکن اس وقت یہ بہت اہم تھا۔

میں آپ کے بات سے متفق ہوں، اب ہم حقیقت میں ٹیپ کے ساتھ سب کچھ چپکا رہے ہیں۔ سب کچھ کنٹیکسٹ ونڈو میں ڈال دیا جا رہا ہے۔ یہ درست نہیں لگ رہا۔ یہاں تک کہ اگر ہم مachines بنارہے ہیں جو حیاتی دماغ نہیں ہیں، جن کے پاس نظریاتی طور پر لاکھوں، کروڑوں کنٹیکسٹ ونڈو ہو سکتی ہیں اور یادداشت مکمل ہو سکتی ہے، لیکن تلاش اور حاصل کرنے کی لاگت اب بھی موجود ہے۔ اس وقت، جب خاص فیصلے کی ضرورت ہے، تو حقیقی طور پر متعلقہ معلومات تلاش کرنا آسان نہیں، چاہے آپ سب کچھ محفوظ کر لیں۔ اس لیے مجھے لگتا ہے کہ یادداشت کے شعبے میں اب بھی بڑی تخلیقی صلاحیت موجود ہے۔

گری ٹن: سچ بولوں تو، ملین ٹوکن کا کنٹیکس ونڈو میری توقع سے کہیں زیادہ بڑا ہے، اور یہ بہت کچھ کر سکتا ہے۔

ڈیمس ہاسابس: اکثر استعمال کے مواقع کے لیے یہ کافی بڑا ہے۔ لیکن سوچیں کہ حوالہ کا ونڈو تقریباً کام کی یادداشت کے برابر ہے۔ انسانی کام کی یادداشت کا اوسط صرف سات اعداد پر مشتمل ہوتا ہے، جبکہ ہمارے پاس لاکھوں یا کروڑوں کے حوالہ ونڈو ہیں۔ مسئلہ یہ ہے کہ ہم اس میں سب کچھ ڈال دیتے ہیں، جس میں غیر ضروری اور غلط معلومات بھی شامل ہیں، اور اب تک یہ طریقہ کافی خشن ہے۔ اگر آپ اب ریل ٹائم ویڈیو اسٹریم کو معالجہ کرنا چاہتے ہیں اور تمام ٹوکن کو بے ترتیب طور پر ریکارڈ کرنا چاہتے ہیں، تو ایک ملین ٹوکن صرف تقریباً 20 منٹ کے لیے کافی ہوں گے۔ لیکن اگر آپ چاہتے ہیں کہ نظام آپ کی دو تین ماہ کی زندگی کو سمجھے، تو اب بھی یہ بہت کم ہے۔

گری ٹن: ڈیپ مائنڈ نے ہمیشہ تقویت سیکھنے اور تلاش میں گہرا ارتکاز کیا ہے، اس فلسفہ کو آپ کے جمینی بنانے کے عمل میں کتنی گہرائی تک شامل کیا گیا ہے؟ کya تقویت سیکھنا اب بھی کم تخمینہ کیا جا رہا ہے؟

ڈیمس ہاسابس: شاید اسے حقیقت میں کم تقویت دی گئی ہے۔ اس شعبے میں دلچسپی کا سطح اونچا نیچا رہا ہے۔ ہم نے DeepMind کے قیام کے پہلے دن سے ہی ایجینٹ سسٹم پر کام شروع کر دیا تھا۔ تمام اٹاری اور AlphaGo پر کیے گئے کام، بنیادی طور پر تقویت سیکھنے والے ایجینٹس تھے، جو خود کار طور پر مقاصد حاصل کرنے، فیصلے لینے اور منصوبہ بندی کرنے کے قابل تھے۔ بالکل ہم نے اس وقت گیمنگ شعبہ منتخب کیا تھا، کیونکہ اس کی پیچیدگی قابل کنٹرول تھی، اور پھر ہم نے تدریجاً زیادہ پیچیدہ گیمز پر کام کیا، جیسے AlphaGo کے بعد ہم نے AlphaStar بنایا، جس سے ہم نے تقریباً تمام ممکنہ گیمز کو کور کر لیا۔

اگلی سوال یہ ہے کہ کیا ہم ان ماڈلز کو صرف گیم ماڈلز کے بجائے عالمی ماڈلز یا زبانی ماڈلز کے طور پر جنرلائز کر سکتے ہیں۔ پچھلے کچھ سالوں سے ہم اسی پر کام کر رہے ہیں۔ آج کے تمام لیڈنگ ماڈلز کا سوچنے کا انداز اور تفکر کی زنجیریں، بنیادی طور پر AlphaGo نے اس وقت شروع کیے گئے اصولوں کی دوبارہ واپسی ہیں۔ مجھے لگتا ہے کہ ہم نے اس وقت جو بہت سے کام کیے تھے، وہ آج بھی بہت متعلق ہیں، اور ہم ان پرانے خیالات کو بڑے پیمانے اور زیادہ جامع طریقے سے دوبارہ جانچ رہے ہیں، جس میں مونٹے کارلو درخت تلاش (Monte Carlo tree search) سمیت مختلف تقویتی سیکھنے کے طریقے شامل ہیں۔ AlphaGo اور AlphaZero کے خیالات آج کے بنیادی ماڈلز کے ساتھ بہت زیادہ متعلق ہیں، اور مجھے لگتا ہے کہ آنے والے کچھ سالوں میں بڑا ترقیاتی فرق اسی سے آئے گا۔

ڈسٹیلیشن اور چھوٹے ماڈل

گری ٹن: اب زیادہ ذکی بننے کے لیے بڑے ماڈل درکار ہیں، لیکن ساتھ ہی دانہ بندی کی ٹیکنالوجی بھی ترقی کر رہی ہے، اور چھوٹے ماڈل کافی تیز ہو سکتے ہیں۔ آپ کا فلش ماڈل بہت طاقتور ہے، جو بنیادی طور پر سب سے آگے کے ماڈلز کے 95 فیصد اثرات تک پہنچ جاتا ہے، لیکن اس کی قیمت صرف دسواں حصہ ہے۔ کیا یہ صحیح ہے؟

ڈیمیس ہاسابس: میرے خیال میں یہ ہمارا ایک مرکزی فائدہ ہے۔ آپ کو سب سے بڑا ماڈل بنانا ہوگا تاکہ اگلی نسل کی صلاحیتیں حاصل کر سکیں۔ ہمارا ایک بڑا فائدہ یہ ہے کہ ہم ان صلاحیتوں کو تیزی سے蒸馏 کر کے چھوٹے اور چھوٹے ماڈلز میں دبایا جا سکتا ہے۔蒸馏 کا یہ طریقہ ہم نے ہی تخلیق کیا تھا، اور اب بھی ہم دنیا کے سب سے بڑے ہیں۔ اور ہمارے پاس اس کام کو کرنے کے لیے مضبوط کاروباری حوصلہ بھی ہے۔ ہم شاید دنیا کا سب سے بڑا AI اطلاقی پلیٹ فارم ہیں۔ AI Overviews اور AI Mode، اور Gemini کے ساتھ، اب گوگل کا ہر پروڈکٹ، جس میں مپس، یوٹیوب سمیت شامل ہیں، Gemini یا متعلقہ ٹیکنالوجیز کو اندراج کر رہا ہے۔ اس میں اربوں صارفین اور دس سے زائد ارب صارفین والے پروڈکٹس شامل ہیں۔ ان کا تھوڑا سا وقت، بہت زیادہ کارآمد، بہت کم لاگت، اور بہت کم تاخیر ہونا ضروری ہے۔ اس سے ہمیں Flash اور چھوٹے Flash-Lite ماڈلز کو بہت زیادہ کارآمد بنانے کے لیے بڑا حوصلہ ملتا ہے، اور میری امید ہے کہ یہ آخرکار صارفین کے تمام کاموں میں مدد کرے گا۔

گری ٹن: میں جاننا چاہتا ہوں کہ یہ چھوٹے ماڈل اتنے ذکی کتنے ہو سکتے ہیں۔ کیا ڈسٹلیشن کا کوئی حد ہے؟ کیا 50B یا 400B کے ماڈل آج کے سب سے بڑے ایڈوانسڈ ماڈلز کے ساتھ اتنے ہی ذکی ہو سکتے ہیں؟

ڈیمیس ہاسابس: میں نہیں سمجھتا کہ ہم اطلاعاتی نظریہ کی حد تک پہنچ چکے ہیں، کم از کم اب تک کسی کو نہیں معلوم کہ کیا ہم اس حد تک پہنچ چکے ہیں۔ شاید کبھی کسی اطلاعاتی گنجائش کی سطح تک پہنچ جائیں گے، لیکن ابھی ہمارا فرض یہ ہے کہ ایک اعلیٰ Pro ماڈل جاری ہونے کے بعد، اس کی صلاحیت کو نصف سال سے ایک سال کے اندر بہت چھوٹے، تقریباً ایج ڈیوائسز پر چلنے والے ماڈل میں دبایا جا سکتا ہے۔ آپ گیما ماڈل پر بھی اس بات کو دیکھ سکتے ہیں، ہمارا Gemma 4 ماڈل اسی سائز میں بہت مضبوط پرفارم کرتا ہے۔ اس میں بڑے پیمانے پر ڈسٹلیشن ٹیکنالوجی اور چھوٹے ماڈلز کی کارکردگی میں بہتری کے تقنيات استعمال ہوئی ہیں۔ اس لئے میرے لئے کوئی نظریاتی حد نظر نہیں آتی، مجھے لگتا ہے کہ ہم اس حد سے بہت دور ہیں۔

گری ٹن: اب ایک بہت عجیب ظاہر ہو رہا ہے کہ انجینئرز کتنی زیادہ کام کر سکتے ہیں—یہ تعداد چھ ماہ پہلے کے مقابلے میں 500 سے 1000 گنا زیادہ ہے۔ اس کمرے میں کچھ لوگ ایسا کام کر رہے ہیں جو 2000 کی دہائی کے ایک گوگل انجینئر کے کام کا 1000 گنا ہے۔ اس بارے میں اسٹیو ییگ نے بات کی تھی۔

ڈیمیس ہاسابس: میں بہت خوش ہوں۔ چھوٹے ماڈلز کے بہت سے استعمال ہیں۔ ایک تو لاگت کم ہوتی ہے اور تیز رفتاری بھی فائدہ مند ہوتی ہے۔ کوڈ لکھنے یا دیگر کاموں میں، آپ خاص طور پر سسٹم کے ساتھ تعاون کرتے ہوئے تیزی سے دوبارہ تجربہ کر سکتے ہیں۔ تیز سسٹم، چاہے وہ سب سے آگے کا نہ ہو، جیسے کہ صرف آگے کے 90 فیصد سے 95 فیصد کا، لیکن یہ بالکل کافی ہے، اور آپ جو تیزی سے دوبارہ تجربہ کرنے میں فائدہ اٹھاتے ہیں، وہ اس 10 فیصد سے بہت زیادہ ہوتا ہے۔

دوسرا بڑا رخ یہ ہے کہ ان ماڈلز کو ایج ڈیوائسز پر چلایا جائے، صرف کارکردگی کے لیے نہیں بلکہ خصوصیات اور محفوظیت کے لیے بھی۔ ایسے مختلف ڈیوائسز کو سوچیں جو بہت زیادہ نجی معلومات کو پروسیس کرتے ہیں، اور روبوٹس، آپ کے گھر کے روبوٹ کے لیے، آپ چاہیں گے کہ ایک موثر اور طاقتور ماڈل مقامی طور پر چلے، اور صرف خاص صورتحال میں ہی کام کو کلاؤڈ پر بڑے ماڈل کو سونپ دیا جائے۔ آڈیو اور ویڈیو اسٹریمنگ دونوں مقامی طور پر پروسیس ہوں گے، اور ڈیٹا مقامی رہے گا، میں یہ سوچ سکتا ہوں کہ یہ ایک بہترین نہایت حالت ہوگی۔

یادداشت اور استدلال

گری ٹن: حوالہ اور یادداشت پر واپس جائیں۔ موجودہ ماڈل غیر حالتی ہے، اگر اس میں مستقل سیکھنے کی صلاحیت ہو تو ڈویلپرز کا تجربہ کیسا ہوگا؟ آپ ایسے ماڈل کو کیسے ہدایت کریں گے؟

ڈیمیس ہاسابس: یہ ایک دلچسپ سوال ہے۔ موجودہ ایجینٹس کے لیے مسلسل سیکھنے کی کمی مکمل کام مکمل کرنے کا ایک اہم رکاوٹ ہے۔ موجودہ ایجینٹس کام کے جزوی اجزاء کے لیے بہت مفید ہیں، آپ انہیں جوڑ کر کچھ دلچسپ چیزیں کر سکتے ہیں، لیکن وہ آپ کے مخصوص ماحول کے ساتھ اچھی طرح مطابقت نہیں رکھتے۔ یہی وجہ ہے کہ وہ ابھی تک "لاUNCH اور بھول جائیں" کے طور پر کام نہیں کر سکتے، انہیں آپ کے مخصوص منظر کو سیکھنے کی ضرورت ہے۔ مکمل عام ذہانت تک پہنچنے کے لیے، اس مسئلے کو حل کرنا ضروری ہے۔

گری ٹن: استدلال کے معاملے میں اب تک کیا ترقی ہوئی ہے؟ ماڈل کی اب تک کی سوچ کی لکیر بہت مضبوط ہے، لیکن کچھ ایسی غلطیاں اب بھی کرتا ہے جو ایک چالاک ایم اے طالب علم نہیں کرتا۔ بالخصوص کیا تبدیلی کی ضرورت ہے؟ استدلال کے حوالے سے آپ کو کس قسم کی ترقی کی توقع ہے؟

ڈیمیس ہاسابس: تفکر کے طریقہ کار میں اب بھی بہت سارے نوٹس کا امکان ہے۔ ہم جو کچھ کر رہے ہیں وہ اب بھی کافی خشن اور زبردست ہے۔ بہت سے بہتری کے راستے ہیں، جیسے کہ تفکر کے سلسلے کی نگرانی کرنا اور تفکر کے درمیان میں مداخلت کرنا۔ میں اکثر محسوس کرتا ہوں کہ چاہے ہمارا سسٹم ہو یا مقابلہ کرنے والے سسٹم، وہ کسی نہ کسی طرح زیادہ سوچتے ہیں اور چکر میں پھنس جاتے ہیں۔

کبھی کبھی میں گیمینی کے ساتھ شطرنج کھیلتے ہوئے مشاہدہ کرنا پسند کرتا ہوں۔ تمام لیڈنگ بنیادی ماڈلز شطرنج کھیلنے میں کافی کمزور ہیں، جو دلچسپ بات ہے۔ ان کے سوچنے کے راستوں کو دیکھنا قیمتی ہے، کیونکہ شطرنج ایک اچھی طرح سے سمجھا گیا شعبہ ہے، اور میں جلدی سے اندازہ لگا سکتا ہوں کہ کیا وہ غلط راستہ اپنا رہے ہیں یا ان کا استدلال مؤثر ہے۔ ہم دیکھتے ہیں کہ کبھی کبھی وہ ایک حرکت پر غور کرتے ہیں، سمجھ جاتے ہیں کہ یہ ایک بری حرکت ہے، لیکن بہتر حرکت نہیں تلاش کر پاتے، اور ایک گھوم کر وہی بری حرکت کر دیتے ہیں۔ ایک درست استدلالی نظام میں ایسا نہیں ہونا چاہئے۔

یہ بہت بڑا فرق اب بھی موجود ہے، لیکن اسے درست کرنے کے لیے صرف ایک یا دو ایڈجسٹمنٹ کی ضرورت ہو سکتی ہے۔ اسی لیے آپ "جیگڈڈ انٹیلیجنس" دیکھتے ہیں جو ایک طرف IMO گولڈ میڈل لیول کے سوالات حل کر سکتی ہے، اور دوسری طرف اگر سوال کو مختلف طرح پوچھا جائے تو بنیادی ریاضی کی غلطیاں کر دیتی ہے۔ اپنے خود کو سوچنے کے عمل پر غور کرنے میں، کچھ کمی نظر آتی ہے۔

ایجینٹ کی اصل صلاحیتیں

گری ٹن: ایجینٹ ایک بڑا موضوع ہے۔ کچھ لوگ اسے سبسکرپشن کہتے ہیں۔ میری ذاتی رائے یہ ہے کہ ابھی شروع ہوا ہے۔ DeepMind کے اندر ایجینٹ کی صلاحیتوں کا حقیقی جائزہ کیا ہے، اور باہر کی تبلیغات سے اس میں کتنا فرق ہے؟

ڈیمیس ہاسابس: میں آپ کے ساتھ متفق ہوں کہ ہم صرف شروع ہوئے ہیں۔ AGI تک پہنچنے کے لیے، آپ کو ایک� ایسا نظام چاہیے جو آپ کے لیے فعال طور پر مسائل حل کرے۔ یہ ہمیشہ ہمارے لیے واضح رہا ہے۔ ایجینٹ ہی وہ راستہ ہے، اور مجھے لگتا ہے کہ ہم صرف شروع ہوئے ہیں۔ سب لوگ ابھی تک یہ تلاش کر رہے ہیں کہ ایجینٹس کو کیسے بہتر طریقے سے ملایا جائے، اور ہم نے ذاتی تجربات میں بہت کچھ کیا ہے، جس میں شاید آج کے یہاں موجود زیادہ تر لوگ بھی شامل ہیں۔ ایجینٹس کو اپنے ورک فلو میں کیسے شامل کیا جائے تاکہ وہ صرف اضافی فائدہ نہ ہوں بلکہ حقیقی بنیادی کام کر سکیں۔ ابھی ہم تجرباتی مرحلے میں ہیں۔ شاید صرف پچھلے دو تین ماہ میں ہم نے حقیقی طور پر بہت قیمتی سیناریوز دریافت کرنے شروع کر دیے ہیں۔ ٹیکنالوجی بھی ابھی تک اس حد تک پہنچ گئی ہے کہ وہ صرف ایک کھلونا ڈمو نہ رہ گئی ہو، بلکہ اب واقعی آپ کے وقت اور کارکردگی میں قدرتی فائدہ لائے جا رہی ہے۔

میں اکثر لوگوں کو دیکھتا ہوں جو دہائیوں کے ایجینٹس شروع کرتے ہیں اور انہیں دہائیوں تک چلاتے ہیں، لیکن میں ابھی تک یہ نہیں جانتا کہ پیداوار اس سرمایہ کاری کے مطابق ہوگی۔

ہم نے اب تک کوئی بھی 3A گیم نہیں دیکھی ہے جو vibe coding کے ذریعے بنائی گئی ہو اور اسٹور کی ٹاپ چارٹ پر پہنچی ہو۔ میں نے خود بھی کچھ لکھا ہے، اور آپ میں سے بہت سے لوگوں نے کچھ اچھے چھوٹے ڈیمو بنائے ہیں۔ میں اب صرف تیس منٹ میں ایک ٹیم پارک کا پروٹوٹائپ بناسکتا ہوں، جبکہ مجھے جب 17 سال کی عمر تھی تو اس کے لیے میں نے چھ ماہ لگائے تھے۔ مجھے احساس ہے کہ اگر آپ ایک پورا سمر اس پر لگا دیں تو آپ حقیقت میں حیرت انگیز چیزیں بناسکتے ہیں۔ لیکن اب بھی اس میں فن، انسانی روح، اور ذائقہ درکار ہے، آپ کو یقینی بنانا ہوگا کہ آپ جو بھی بناتے ہیں، اس میں یہ سب کچھ شامل ہو۔ حقیقت میں، اب تک کوئی بچہ ایسا گیم نہیں بنایا جو کروڑوں نسخے فروخت ہوئے ہوں، جبکہ موجودہ ٹولز کے حساب سے یہ ممکن ہونا چاہیے۔ تو کچھ کم ہے، شاید عمل کے ساتھ، شاید ٹولز کے ساتھ۔ میں توقع کرتا ہوں کہ آنے والے 6 سے 12 ماہ میں ہم اس قسم کا نتیجہ دیکھیں گے۔

گری ٹن: اس میں کتنی حد تک مکمل طور پر خودکار ہونے کا امکان ہے؟ مجھے لگتا ہے کہ شروع میں مکمل طور پر خودکار نہیں ہوگا۔ زیادہ امکان ہے کہ موجودہ لوگ پہلے 1000 گنا کارکردگی حاصل کریں، پھر کوئی ان ٹولز کا استعمال کرتے ہوئے کامیاب ایپلیکیشن یا کامیاب گیم بنائے، اس کے بعد ہی زیادہ تر مراحل خودکار ہو جائیں گے۔

ڈیمیس ہاسابس: ہاں، یہی وہ چیز ہے جو آپ کو پہلے دیکھنی چاہیے۔

گری ٹن: ایک حصہ وجہ یہ بھی ہے کہ کچھ لوگ ایسا کر رہے ہیں، لیکن وہ یہ نہیں کہنا چاہتے کہ ایجنٹ نے کتنی مدد کی ہے۔

ڈیمیس ہاسابس: شاید۔ لیکن میں تخلیقی صلاحیت کے بارے میں بات کرنا چاہوں گا۔ میں اکثر الفاگو کا مثال دیتا ہوں، جس میں دوسرے گیم کا 37واں موو مشہور ہے۔ میرے لیے، میں ہمیشہ ایسے لمحے کا انتظار کرتا رہا، جب وہ آیا تو میں نے الفا فولڈ جیسے سائنسی منصوبوں کو شروع کر دیا۔ ہم نے سیول سے واپسی کے اگلے دن الفا فولڈ پر کام شروع کر دیا، جو دس سال پہلے کی بات ہے۔ میں اس بار کوریا آیا ہوں تاکہ الفاگو کے دس سال مکمل ہونے کا جشن منایا جا سکے۔

لیکن صرف موو 37 سے باہر نکلنا کافی نہیں۔ یہ دلچسپ اور مفید ہے۔ لیکن کیا یہ سسٹم گو کھیل کا ایجاد کر سکتا ہے؟ اگر آپ اسے ایک اعلیٰ سطح کا تفصیل دیں، جیسے "ایک ایسا کھیل جس کے قواعد پانچ منٹ میں سیکھے جا سکتے ہیں لیکن جس کی مہارت حاصل کرنے میں پوری زندگی لگ جائے، جو خوبصورتی کے لحاظ سے شاندار ہے اور ایک دوپہر میں ایک میچ ختم ہو جاتا ہے"، اور پھر سسٹم آپ کو جواب میں گو دے دے۔ آج کے سسٹم اسے نہیں کر سکتے۔ سوال یہ ہے کہ کیوں؟

گری ٹن: حاضرین میں سے کوئی بھی اسے کر سکتا ہے۔

ڈیمس ہاسبیس: اگر کوئی ایسا کر پایا، تو اس کا مطلب یہ نہیں کہ سسٹم میں کچھ کمی ہے، بلکہ ہم نے سسٹم کا استعمال غلط طریقے سے کیا ہے۔ شاید یہی صحیح جواب ہے۔ شاید آج کے سسٹم میں یہ صلاحیت پہلے سے موجود ہے، صرف ایک کافی ذہین مصنف کی ضرورت ہے جو اسے چلائے، اس منصوبے کو اس کی روح دے، اور جو اوزاروں کے ساتھ اتنی گہری طرح سے ادغام ہو جائے کہ تقریباً اوزار کے ساتھ ایک ہو جائے۔ اگر آپ ان اوزاروں میں روز و شب غوطہ زن رہیں اور گہری تخلیقی صلاحیت رکھتے ہوں، تو شاید آپ ان خيالات سے بھی آگے کچھ بنانے میں کامیاب ہو جائیں۔

اوپن سورس اور ملٹی موڈل ماڈل

گری ٹن: کھلے ذرائع کے بارے میں ایک اور موضوع پر بات کرتے ہیں۔ حالیہ گیما کے اجرا سے بہت طاقتور ماڈلز مقامی طور پر چلنا شروع ہو گئے ہیں۔ آپ کی کیا رائے ہے؟ کیا AI صارفین کے اپنے ہاتھوں میں چلی جائے گی، نہ کہ صرف کلاؤڈ پر رہے گی؟ کیا اس سے ان ماڈلز کو استعمال کرکے پروڈکٹس بنانے والوں کی شناخت بدل جائے گی؟

ڈیمس ہاسابس: ہم اوپن سورس اور اوپن سائنس کے مضبوط حامی ہیں۔ آپ نے جو الفا فولڈ کا ذکر کیا، ہم نے اسے مکمل طور پر مفت کر دیا ہے۔ ہمارا سائنسی کام اب تک بھی اعلیٰ جرائد میں شائع ہوتا رہا ہے۔ جیما کے حوالے سے، ہم اسی سائز کے لیے دنیا کا بہترین ماڈل تیار کرنا چاہتے ہیں۔ اب تک جیما کی ڈاؤن لوڈز تقریباً 40 ملین ہو چکی ہیں، اور صرف دو اور نصف ہفتے گزرے ہیں۔

میں اس بات پر بھی یقین رکھتا ہوں کہ اوپن سورس کے شعبے میں مغربی ٹیکنالوجی اسٹیک کا وجود اہم ہے۔ چینی اوپن سورس ماڈل بہت عالی ہیں اور ابھی اوپن سورس شعبے میں لیڈر ہیں، لیکن ہم سمجھتے ہیں کہ Gemma اسی سائز کے تحت بہت مقابلہ کرنے والا ہے۔

ہمارے لیے ایک وسائل کا مسئلہ بھی ہے، کوئی بھی دو بڑے سرحدی ماڈلز کے لیے اضافی کمپوٹیشنل طاقت نہیں رکھتا۔ اس لیے ہمارا موجودہ فیصلہ یہ ہے کہ اینڈرائڈ، چشمے، روبوٹس وغیرہ کے لیے ایج ماڈلز استعمال کیے جائیں، اور انہیں کھلا ماڈل بنانا بہتر ہے، کیونکہ ایک بار ڈیوائس پر ڈپلوی ہو جانے کے بعد وہ خود بخود اExposed ہو جاتے ہیں، تو بہتر ہے کہ انہیں مکمل طور پر کھول دیا جائے۔ ہم نے نینومیٹر سطح پر کھلے پالیسی کو یکساں کر دیا ہے، جو سٹریٹجک طور پر بھی منطقی ہے۔

گری ٹن: اسٹیج پر آنے سے پہلے میں نے آپ کو اپنا بنایا ہوا AI آپریٹنگ سسٹم دکھایا، میں نے جیمینی کے ساتھ براہ راست آواز کے ذریعے تعامل کیا اور چیزیں دکھانے کے لیے میں تھوڑا تناؤ محسوس کر رہا تھا، لیکن اس نے کام کر لیا۔ جیمینی شروع سے ہی متعدد ماڈلز پر مشتمل تھا۔ میں نے بہت سے ماڈلز استعمال کیے ہیں، لیکن آواز سے براہ راست ماڈل تک کا تعامل، ٹول کال کی صلاحیت اور حوالہ کی گہرائی اور سیاق و سباق کی سمجھ کے لحاظ سے، اب تک کوئی بھی ماڈل جیمینی کے مقابلے میں نہیں ہے۔

ڈیمیس ہساسبس: ہاں۔ جیمینی سیریز کا ایک ایسا فائدہ جس کو اب تک کافی نہیں سمجھا گیا، وہ یہ ہے کہ ہم نے شروع سے ہی متعدد ماڈلز کے ساتھ تعمیر کیا۔ اس سے شروعاتی مرحلہ صرف متن پر مبنی ہونے کے مقابلے میں مشکل تھا، لیکن ہمیں یقین ہے کہ طویل مدت میں ہم اس سے فائدہ اٹھائیں گے، اور اب یہ فائدہ شروع ہو چکا ہے۔ مثال کے طور پر، عالمی ماڈلز کے حوالے سے، ہم نے جینی (ڈیپ مائنڈ کا جنریٹو انٹرایکٹو ایونٹ ماڈل) جیمینی کے اوپر تعمیر کیا ہے۔ روبوٹکس کے شعبے میں بھی، جیمینی روبوٹکس متعدد ماڈلز پر مبنی ہوگا، اور ہمارا متعدد ماڈلز پر فائدہ مقابلے کا ایک تحفظ بن جائے گا۔ ہم Waymo (الفابیٹ کا خودکار گاڑیوں والا کمپنی) میں بھی جیمینی کا استعمال بڑھا رہے ہیں۔

اپنے اردگرد کے فزیکل دنیا اور ماحول کو سمجھنے والا ایک ڈیجیٹل اسسٹنٹ کا تخیل کریں، جو شاید آپ کے فون یا چشمے پر ہو، ہمارا سسٹم اس حوالے سے بہت طاقتور ہے۔ ہم اس سمت میں مزید سرمایہ کاری جاری رکھیں گے، اور میرا خیال ہے کہ ہمارا اس قسم کے مسائل میں لیڈر شپ بہت بڑا ہے۔

گری ٹن: استدلال کی لاگت تیزی سے کم ہو رہی ہے۔ جب استدلال بنیادی طور پر مفت ہو جائے، تو کیا ممکن ہو جاتا ہے؟ کیا آپ کی ٹیم کی بہتری کی سمت اس کے ساتھ بدل جائے گی؟

ڈیمیس ہساسبس: میں یقینی طور پر نہیں سمجھتا کہ استدلال مفت ہو جائے گا، کیونکہ جیونز کا متناقضہ (Jevons' Paradox) موجود ہے — جہاں کارکردگی میں اضافہ کے باوجود کل استعمال بڑھ جاتا ہے۔ میرا خیال ہے کہ سب کچھ جو انہیں حاصل ہو سکتا ہے، وہ تمام کمپوٹنگ طاقت استعمال کر لیں گے۔ آپ سوچ سکتے ہیں کہ لاکھوں ایجنٹس ایک ساتھ مل کر کام کر رہے ہوں، یا ایک چھوٹا سا گروپ ایجنٹس متعدد راستوں پر ایک ساتھ سوچ رہا ہو اور پھر ان کا ادغام کر رہا ہو۔ ہم سب ان راستوں کا تجربہ کر رہے ہیں، اور یہ سب کچھ دستیاب استدلال وسائل کو استعمال کرے گا۔

انرجی کے حوالے سے، اگر ہم کنٹرولڈ نیوکلیئر فیوژن، روم ٹیمپریچر سپرکنڈکٹیوٹی، اور بہترین بیٹری جیسے مسائل میں سے کچھ کو حل کر لیں، تو میں سمجھتا ہوں کہ مواد کی سائنس کے ذریعے ہم اسے حاصل کر سکتے ہیں، تو انرجی کی لاگت صفر کی طرف جا سکتی ہے۔ لیکن چپ کے فزیکل تیاری جیسے مراحل اب بھی رکاوٹیں ہیں، کم از کم اگلے کئی دہائیوں تک۔ اس لیے ریزنگ انجن پر اب بھی کوٹا کی پابندیاں رہیں گی، اور ہمیں ان کا موثر طریقے سے استعمال کرنا ہوگا۔

اگلی سائنسی کامیابی

گری ٹن: اچھا ہے کہ چھوٹے ماڈلز اب زیادہ ذکی ہو رہے ہیں۔ یہاں بہت سے حیاتیات اور حیاتیاتی ٹیکنالوجی کے بانی موجود ہیں۔ AlphaFold 3 اب پروٹین کے علاوہ مزید وسیع生物分子 تک پھیل چکا ہے۔ کیا ہم مکمل سیل سسٹم کے ماڈلنگ تک پہنچنے سے صرف ایک قدم دور ہیں؟ کیا یہ ایک بالکل مختلف درجہ کی مشکل مسئلہ ہے؟

ڈیمیس ہاسابس: ایزومورفک لیبز کی پیش رفت بہت اچھی ہے۔ الفا فولڈ صرف دوائوں کی دریافت کے عمل کا ایک حصہ ہے، ہم متعلقہ بائیو کیمیکل تحقیق کر رہے ہیں، درست خصوصیات والے مرکبات ڈیزائن کر رہے ہیں، جلد ہی بڑی اعلانات ہوں گے۔

ہمارا نہایت مقصد ایک مکمل ورچوئل سیل بنانا ہے، ایک مکمل فنکشنل سیل سیمولیٹر جس پر آپ پریشانیاں ڈال سکیں، جس کا آؤٹ پٹ تجرباتی نتائج کے قریب ہو اور عملی استعمال رکھے۔ آپ بہت سارے تلاش کے مراحل کو چھوڑ سکتے ہیں، بہت سارے مصنوعی ڈیٹا کو جنریٹ کر سکتے ہیں تاکہ دوسرے ماڈلز کو تربیت دی جا سکے اور وہ حقیقی سیلز کے رویے کا پیشن گوئی کر سکیں۔

میں کہتا ہوں کہ مکمل ورچوئل سیل تک ابھی تقریباً دس سال باقی ہیں۔ ہم ڈیپ مائنڈ کے سائنس سائیڈ پر سیل کے مرکز سے شروع کر رہے ہیں، کیونکہ مرکز نسبتاً خود کافی ہے۔ اس قسم کے مسائل کا اہم پہلو یہ ہے کہ کیا آپ ایک مناسب درجہ کی پیچیدگی والی ٹکڑا نکال سکتے ہیں جو کافی خود محتوی ہو، جس کے ان پٹ اور آؤٹ پٹ کو آپ مناسب طریقے سے تقریبی بناسکیں، اور پھر اس ذیلی نظام پر توجہ مرکوز کر سکیں۔ مرکز اس نقطہ نظر سے بہت مناسب ہے۔

ایک اور مسئلہ یہ ہے کہ ڈیٹا کم ہے۔ میں نے الیکٹران مائیکروسکوپی اور دیگر تصویر سازی ٹیکنالوجیز میں ماہر سائنسدانوں سے بات کی ہے۔ اگر زندہ سیلز کی تصویر لی جا سکے بغیر انہیں مارے، تو یہ انقلابی ہو جائے گا۔ کیونکہ اسے ایک بصری مسئلہ میں تبدیل کیا جا سکتا ہے، اور بصری مسائل کا حل ہم جانتے ہیں۔ لیکن جتنا میرا علم ہے، اب تک کوئی ٹیکنالوجی نہیں ہے جو نینومیٹر رزولوشن پر زندہ، گتھل سیلز کی تصویر لے سکے اور انہیں نقصان نہ پہنچائے۔ آپ اس رزولوشن پر سٹیٹک تصویریں لے سکتے ہیں، جو اب بہت ترقی یافتہ ہیں، اور یہ دلچسپ ہے، لیکن اسے براہ راست ایک بصری مسئلہ میں تبدیل کرنے کے لیے کافی نہیں۔

تو دو راستے ہیں، ایک ہارڈویئر ڈرائیون اور ڈیٹا ڈرائیون حل؛ دوسرا بہتر قابل سیکھنے والے سیمولیٹر بنانا جو ان ڈائنامکس سسٹمز کو سیمولیٹ کرے۔

گری ٹن: آپ صرف زندہ جانوروں کو نہیں دیکھ رہے۔ مادے کی سائنس، دوا کی دریافت، موسمی ماڈلنگ، ریاضی، اگر ترتیب دینی پڑے تو اگلے پانچ سالوں میں کون سا سائنسی شعبہ سب سے زیادہ تبدیل ہو جائے گا؟

ڈیمیس ہاسابس: ہر شعبہ دلچسپ ہے، اور اسی لیے یہ میری سب سے بڑی جذبہ رہا ہے، اور میں نے 30 سالوں تک AI پر کام کیا ہے۔ میں ہمیشہ سوچتا رہا ہوں کہ AI علم کا آخری ٹول ہوگا جو علمی سمجھ، علمی دریافت، طب اور ہماری کائنات کے بارے میں تجربے کو آگے بڑھائے گا۔

ہم نے اپنی مشن کو شروع میں دو مرحلوں میں بیان کیا تھا۔ پہلا مرحلہ، ذہانت کو حل کرنا، یعنی AGI تعمیر کرنا؛ دوسرا مرحلہ، اسے دیگر تمام مسائل کو حل کرنے کے لیے استعمال کرنا۔ بعد میں ہمیں الفاظ تبدیل کرنے پڑے، کیونکہ لوگ پوچھتے تھے، «کیا تم سچ مچ سب مسائل کو حل کرنے کا مطلب رکھتے ہو؟» ہاں، ہم بالکل اسی کا مطلب رکھتے ہیں۔ اب لوگ شروع کر رہے ہیں کہ اس کا کیا مطلب ہے۔ خاص طور پر، میں ان سائنسی شعبوں کا حوالہ دے رہا ہوں جنہیں میں «روٹ نوڈ مسائل» کہتا ہوں، وہ شعبے جن میں ایک ٹوٹ کر دوسرے نئے دریافتوں کی شاخیں کھل جائیں۔ AlphaFold ہمارے کرنے کے مطلوبہ عمل کا نمونہ ہے۔ دنیا بھر میں تین ملین سے زائد تحقیق کار، تقریباً ہر جینیاتی تحقیق کار اب AlphaFold استعمال کر رہے ہیں۔ میں نے کچھ فارماسیوٹکل کمپنیوں کے اعلیٰ انتظامی دوستوں سے سنا ہے کہ آئندہ دریافت ہونے والی تقریباً ہر دوا، دوا دریافت کے عمل کے کسی نہ کسی مرحلے میں AlphaFold کا استعمال کرے گی۔ ہم اس بات پر فخر محسوس کرتے ہیں، اور یہی وہ اثر ہے جس کا ہم AI سے انتظار کرتے ہیں۔ لیکن مجھے لگتا ہے کہ یہ صرف شروعات ہے۔

میں ایسا کوئی سائنس یا انجینئرنگ کا شعبہ نہیں سوچ سکتا جس میں AI کی مدد نہ ہو۔ آپ جن شعبوں کا ذکر کر رہے ہیں، میرے خیال میں وہ تقریباً “AlphaFold 1” کے لمحے پر ہیں — نتائج بہت وعدہ کرتے ہیں، لیکن ابھی تک ان شعبوں کے بڑے چیلنجوں کو حل نہیں کیا گیا۔ آنے والے دو سالوں میں ہم ان تمام شعبوں، مٹیریل سائنس سے لے کر ریاضی تک، میں بہت ساری ترقی کے بارے میں بات کریں گے۔

گری ٹن: ایسے لگ رہا ہے جیسے پرومتھیوس نے انسانوں کو ایک بالکل نئی صلاحیت عطا کر دی ہو۔

ڈیمیس ہاسابس: جی ہاں۔ بالکل، جیسے پرومیتھیوس کے کہانی کا سبق ہے، ہمیں اس صلاحیت کے استعمال، اس کے استعمال کی جگہ، اور ایک ہی ٹولز کے غلط استعمال کے خطرے کو لے کر احتیاط برتنا چاہیے۔

کامیابی کا تجربہ

گری ٹن: آج کے اجلاس میں بہت سے لوگ AI کو سائنس میں застосувати کرنے والی کمپنیاں شروع کرنے کی کوشش کر رہے ہیں۔ آپ کے خیال میں، ایسی حقیقی سائنس کے اگلے مرحلے کو آگے بڑھانے والی کمپنیاں اور صرف بنیادی ماڈل پر API لگا کر خود کو "AI for Science" کہنے والی کمپنیاں میں کیا فرق ہے؟

ڈیمس ہاسبیس: میں سوچ رہا ہوں کہ اگر آج میں آپ کی جگہ بیٹھا، Y Combinator میں پروجیکٹس دیکھ رہا ہوں، تو میں کیا کروں گا۔ ایک بات یہ ہے کہ آپ کو AI ٹیکنالوجی کے رجحان کا پیش گوئی کرنا ہوگا، جو خود بخود مشکل ہے۔ لیکن میں واقعی سمجھتا ہوں کہ AI کے رجحان کو دوسرے گہرے ٹیکنالوجی کے شعبے سے جوڑنا، بہت بڑا موقع ہے۔ یہ تقاطع، چاہے میٹریل، طب ہو یا دیگر حقیقی طور پر مشکل سائنسی شعبے، خاص طور پر اٹامک دنیا سے متعلق، قابل تصور مستقبل میں کوئی جلدی راستہ نہیں ہوگا۔ ان شعبوں کو اگلے بنیادی ماڈل اپڈیٹ سے نہیں دھکیلا جائے گا۔ لیکن اگر آپ مضبوط دفاعی سمت تلاش کر رہے ہیں، تو یہی وہ سمت ہے جس کی میں تجویز کروں گا۔

میں ہمیشہ گہری ٹیکنالوجی کو ترجیح دیا ہے۔ حقیقی طور پر مستقل اور قیمتی چیزیں آسان نہیں ہوتیں۔ میں ہمیشہ گہری ٹیکنالوجی سے متاثر رہا ہوں۔ 2010 میں جب ہم نے شروع کیا تو AI گہری ٹیکنالوجی تھی — سرمایہ کار مجھے بتا رہے تھے کہ “ہم جانتے ہیں کہ یہ کام نہیں کرے گا”، اور اکادمک دنیا بھی سمجھتی تھی کہ یہ ایک ایسا مخصوص رجحان ہے جسے 90 کی دہائی میں آزمایا گیا تھا اور ناکام رہا۔ لیکن اگر آپ اپنے خیال پر یقین رکھتے ہیں — کیوں اب مختلف ہوگا، آپ کے پاس کون سا منفرد مجموعہ ہے — بہترین صورت میں آپ خود ماشین لرننگ اور اطلاقی شعبوں میں ماہر ہوں، یا آپ ایسا بنیادی ٹیم تشکیل دے سکتے ہو — تو اس میں بڑا اثر اور قدرت بنانے کا موقع موجود ہے۔

گری ٹن: یہ معلومات اہم ہیں۔ ایک چیز کو کامیابی کے ساتھ مکمل کرنے کے بعد اسے معمول سا لگتا ہے، لیکن اسے کامیاب بنانے سے پہلے سب آپ کے خلاف ہوتے ہیں۔

ڈیمیس ہاسابس: بے شک، تو آپ کو اس بات پر عمل کرنا چاہیے جس کے لیے آپ کو واقعی جذبہ ہو۔ میرے لیے، جو بھی ہو رہا ہو، میں AI کروں گا۔ میں نے اپنی چھوٹی عمر میں فیصلہ کر لیا تھا کہ یہی وہ چیز ہے جس کا اثر میں سوچ سکتا ہوں۔ اور اب تک یہ ثابت ہو چکا ہے، لیکن شاید یہ نہ بھی ہو سکتا تھا، شاید ہم 50 سال پہلے ہی آ گئے تھے۔ اور یہ میرے لیے سب سے دلچسپ بات بھی ہے جسے میں سوچ سکتا ہوں۔ اگر آج بھی ہم ایک چھوٹے گاراج میں بیٹھے ہوں اور AI ابھی تک بنایا نہ گیا ہو، تو بھی میں اسے جاری رکھنے کا کوئی طریقہ نکال لوں گا۔ شاید میں اکادمک دنیا میں واپس آ جاؤں، لیکن میں کسی نہ کسی طرح جاری رکھنے کا راستہ تلاش کر لوں گا۔

گری ٹن: الفا فولڈ آپ کے ایک سمت پر کام کرنے اور اس پر سہی اندازہ لگانے کا مثالی مسئلہ ہے۔ کسی سائنسی شعبے کو الفا فولڈ جیسی کامیابی کے لیے کیا موزوں بناتا ہے؟ کیا کوئی قانون ہے، جیسے کوئی مقصد فنکشن؟

ڈیمیس ہاسابس: میں واقعی اسے لکھنے کا ایک وقت نکالنا چاہوں گا۔ ایلفاگو اور ایلفافولڈ جیسے تمام ایلفا منصوبوں سے میں نے سیکھا ہے کہ ہماری موجودہ ٹیکنالوجی درج ذیل صورتوں میں بہترین طریقے سے کام کرتی ہے۔ پہلا، مسئلہ کا ترکیبی تلاش کا خلیہ بہت بڑا ہو، جتنا بڑا ہو سکے، اتنا بڑا کہ کوئی بروٹ فورس ایکسھاسٹیو یا خاص الگورتھم اسے حل نہ کر سکے۔ گو کے موو کا اسپیس اور پروٹین کا کنفگریشن اسپیس دونوں کائنات میں موجود ایٹومز کی تعداد سے بہت زیادہ ہیں۔ دوسرا، آپ مقصد فنکشن کو واضح طور پر تعریف کر سکتے ہیں، جیسے پروٹین کی فری انرجی مینیمائزیشن، یا گو میں جِتنے کا مقصد، تاکہ سسٹم گریڈینٹ اسکینڈ میں کام کر سکے۔ تیسرے، کافی ڈیٹا ہو، یا ایک س뮬یٹر ہو جو زبردست مقدار میں سنتھٹک ڈیٹا جنریٹ کر سکے۔

اگر یہ تین شرائط پوری ہوتی ہیں، تو آج کے طریقے سے آپ اپنی ضرورت کی "اون کے ڈھیر میں سے سُی" تلاش کرنے میں بہت دور جا سکتے ہیں۔ دوائیوں کی دریافت میں بھی وہی منطق ہے: ایک ایسا مرکب وجود رکھتا ہے جو اس بیماری کا علاج کر سکے اور اس کے کوئی مضر اثرات نہ ہوں، اگر فزکس کے قوانین اس کے وجود کی اجازت دیتے ہیں، تو صرف ایک ہی سوال ہے کہ اسے کس طرح موثر اور عملی طریقے سے تلاش کیا جائے۔ میرا خیال ہے کہ AlphaFold نے پہلی بار ثابت کیا کہ اس قسم کے نظام قابلِ عمل ہیں جو بے شمار تلاش کے خلائوں میں اس سُی کو تلاش کر سکتے ہیں۔

گری ٹن: میں ایک سطح اونچی کرنا چاہتا ہوں۔ ہم اس بات پر بات کر رہے ہیں کہ انسانوں نے ان طریقوں کا استعمال کرکے AlphaFold بنایا، لیکن ایک اور میٹا سطح بھی ہے جہاں انسان AI کا استعمال کرتے ہیں تاکہ ممکنہ فرضیات کے خلیہ کا جائزہ لیں۔ کیا ہم AI سسٹمز کو حقیقی سائنسی استدلال (صرف ڈیٹا پر مبنی نمونوں کے بجائے) کرنے کے قریب ہو گئے ہیں؟

ڈیمیس ہاسابس: میں سمجھتا ہوں کہ ہم بہت قریب ہیں۔ ہم اس قسم کے جامع نظام پر کام کر رہے ہیں۔ ہمارے پاس ایک AI co-scientist نامی نظام ہے، اور AlphaEvolve جیسے الگورتھم جو بنیادی Gemini سے آگے بڑھ کر کام کرتے ہیں۔ تمام اگرے والے لیبز اس راستے کی تلاش کر رہے ہیں۔

لیکن اب تک، میں نے ذاتی طور پر کوئی اصل، بڑا سائنسی دریافت نہیں دیکھی ہے جو ان نظاموں نے کی ہو۔ میں سمجھتا ہوں کہ یہ جلد آ رہا ہے۔ یہ ہماری پہلے بحث کیا گیا تخلیقی صلاحیت سے متعلق ہو سکتا ہے، جہاں معلوم حدود کو حقیقی طور پر پار کیا جائے۔ اس سطح پر، یہ مطابقت کا مسئلہ نہیں ہے، کیونکہ کوئی مطابقت کے لیے نمونہ نہیں ہوتا۔ یہ صرف اظہار کا مسئلہ بھی نہیں، بلکہ کچھ تشبیہاتی استدلال (analogical reasoning) ہے، جسے میں سمجھتا ہوں کہ ان نظاموں کے پاس اب تک نہیں ہے، یا ہم نے انہیں صحیح طریقے سے استعمال نہیں کیا ہے۔

میں سائنسی شعبے میں اکثر ایک معیار بیان کرتا ہوں کہ کیا یہ ایک حقیقی دلچسپ فرضیہ پیش کر سکتا ہے، صرف ایک فرضیہ کی تصدیق کرنے کے بجائے۔ کیونکہ ایک فرضیہ کی تصدیق کرنا بھی ایک بڑا کام ہو سکتا ہے، جیسے ریمان فرضیہ کا ثبوت دینا یا کسی ملینیم انعام کے مسئلے کو حل کرنا، لیکن شاید ہم اس مرحلے تک پہنچنے سے صرف کچھ سال دور ہیں۔

اس سے زیادہ مشکل بات یہ ہے کہ کیا ہم ایک نئی مجموعہ دہائی کے مسائل پیش کر سکتے ہیں جو انتہائی ماہر ریاضیدانوں کے لیے بھی اتنے ہی گہرے اور ایک زندگی کی تحقیق کے قابل ہوں؟ مجھے لگتا ہے کہ یہ ایک درجہ زیادہ مشکل ہے، اور ہم اب تک نہیں جانتے کہ اسے کیسے حاصل کیا جائے۔ لیکن میں نہیں سوچتا کہ یہ کوئی جادو ہے، میں یقین رکھتا ہوں کہ یہ نظام آخرکار اسے حاصل کر لیں گے، شاید صرف ایک یا دو چیزوں کی کمی ہے۔

ہم جس طرح کا ٹیسٹ استعمال کر سکتے ہیں، اسے میں کبھی کبھی "ائناسٹائن ٹیسٹ" کہتے ہیں، یعنی کیا آپ 1901 کے علم کے ساتھ ایک سسٹم تربیت دے سکتے ہیں، اور پھر اسے خود سے اینسٹائن کے 1905 کے نتائج، جیسے خاص نسبیت اور اس سال کی دیگر تحریریں، استنباط کرنے دے سکتے ہیں؟ مجھے لگتا ہے کہ ہمیں اس ٹیسٹ کو حقیقت میں چلانا چاہئے، بار بار آزمانا چاہئے، اور دیکھنا چاہئے کہ ہم کب تک پہنچ سکتے ہیں۔ جب ہم اسے کر پائیں، تو ان سسٹمز کو اصل میں نئی چیزوں کی ایجاد کرنے سے صرف ایک قدم دور رہ جائے گا۔

کاروباری تجاویز

گری ٹن: آخری سوال۔ یہاں بیٹھے بہت سے لوگوں کے پاس گہری ٹیکنیکل پس منظر ہے جو آپ کے جیسا بڑا کام کرنا چاہتے ہیں، آپ دنیا کے سب سے بڑے AI تحقیقی اداروں میں سے ایک ہیں۔ آپ AGI تحقیق کی سب سے آگے کی لائن سے گزر چکے ہیں، کون سی بات ہے جو آج آپ جانتے ہیں لیکن آپ 25 سال کی عمر میں جاننا چاہتے تھے؟

ڈیمس ہاسابس: ہم اس بات پر پہلے ہی بات کر چکے ہیں۔ آپ پائیں گے کہ مشکل سوالات اور آسان سوالات کا پیچیدہ ہونا تقریباً ایک جیسا ہے، صرف مشکل ہونے کا انداز مختلف ہے۔ مختلف چیزوں کی مختلف مشکلات ہوتی ہیں۔ لیکن زندگی لمبی نہیں اور توانائی محدود ہے، اس لیے اپنی زندگی کو اس چیز پر لگائیں جو اگر آپ نے نہیں کی تو کوئی اور نہیں کرے گا۔ اس معیار کو اپنے انتخاب کے لیے استعمال کریں۔

ایک اور بات، میں سمجھتا ہوں کہ آنے والے کچھ سالوں میں علاقوں کے درمیان ترکیبیں زیادہ عام ہو جائیں گی، ای آئی علاقوں کے درمیان جڑنے کو آسان بنائے گی۔

آخری بات آپ کے AGI کے وقت کے منصوبے پر منحصر ہے۔ میرا 2030 کے تقریباً اردگرد ہے۔ اگر آج آپ ایک گہری ٹیکنالوجی پروجیکٹ شروع کرتے ہیں، تو عام طور پر اس کا مطلب دس سال کی سفر ہوتا ہے۔ اس کا مطلب ہے کہ آپ کو AGI کے درمیان میں ظاہر ہونے کا خیال رکھنا ہوگا۔ اس کا کیا مطلب ہے؟ یہ ضروری طور پر بری بات نہیں ہے، لیکن آپ کو اس کا خیال رکھنا ہوگا۔ کیا آپ کا پروجیکٹ AGI کا استعمال کر سکتا ہے؟ AGI سسٹم آپ کے پروجیکٹ کے ساتھ کیسے تعامل کرے گا؟

پہلے بات چیت کے مطابق، AlphaFold اور جنرل AI سسٹم کے درمیان تعلق کے بارے میں، میں ایک ایسی صورتحال کا تصور کر سکتا ہوں جس میں Gemini، Claude یا اس جیسے جنرل سسٹم، AlphaFold جیسے مخصوص سسٹم کو ایک ٹول کے طور پر استعمال کرتے ہیں۔ میں نہیں سوچتا کہ ہم سب کچھ ایک بڑے، واحد "دماغ" میں ڈال دیں گے؛ اگر Gemini میں تمام پروٹین ڈیٹا ڈال دیا جائے تو اس کا کوئی معنی نہیں، کیونکہ Gemini کو پروٹین فولڈنگ کرنے کی ضرورت نہیں۔ آپ کے ذکر کردہ معلومات کی کارآمدی پر واپس آئیں، وہ تمام پروٹین ڈیٹا ضرور اس کی زبانی صلاحیتوں کو متاثر کرے گا۔ بہتر طریقہ یہ ہوگا کہ بہت مضبوط جنرل ٹول استعمال کرنے والے ماڈل ہوں جو ان مخصوص ٹولز کو بلاتے ہوں یا ان کو ٹرین کر سکیں، لیکن مخصوص ٹولز الگ الگ سسٹم ہوں۔

یہ خیال پر غور کرنے کی ضرورت ہے، کیونکہ یہ آپ کے آج کے کام کو متاثر کرتا ہے، جس میں آپ کون سی فیکٹریاں بنائیں گے، کون سا مالی نظام بنائیں گے۔ آپ کو AGI کے وقت کا خیال رکھنا چاہیے، اس دنیا کو تصور کرنا چاہیے جو اس وقت پیدا ہوگی، اور پھر ایک ایسا چیز تعمیر کرنا چاہیے جو اس دنیا کے آنے پر بھی مفید رہے۔