فی فی لی ایک بحث کو ختم کرنا چاہتی ہیں جو AI کے شعبے میں کچھ عرصہ سے جاری ہے: "دنیا کا ماڈل" کیا ہے اور کیا صرف ایک لیب کوٹ پہنے ہوئے جدید ویڈیو جنریٹر ہے۔
اسٹنفورڈ کے پروفیسر اور ورلڈ لیبز کے سی ای او نے 3 جون، 2026 کو "عالمی ماڈلز کا ایک فنکشنل ٹیکسونومی" شائع کیا، جس میں عالمی ماڈلز کو تین الگ الگ فنکشنز: رینڈرر، سیمولیٹر، اور پلانر میں درجہ بندی کی گئی۔ اس پیپر میں دلیل دی گئی ہے کہ یہ تین کردار ایک باہمی منسلک لوپ تشکیل دیتے ہیں جو لی کے "مکاناتی ذہانت" کا بنیادی احاطہ بناتے ہیں، وہ قسم کی AI جو فزیکل ماحول کو سمجھ سکتی اور اس کے ساتھ تعامل کر سکتی ہے۔
تین نوکریاں، ایک ماڈل
رینڈر فنکشن ویژول جنریشن کو سنبھالتا ہے۔ یہ ڈیٹا ان پٹس سے اعلیٰ درجہ کی ویژول نمائشیں تخلیق کرتا ہے۔ یہی وہ چیز ہے جو موجودہ "دنیا کے ماڈلز" اصل میں کرتے ہیں، اور لی نے واضح دلیل دی ہے کہ اس سطح پر گھسٹے رہنے والے سسٹم اصل دنیا کے ماڈلز نہیں ہیں۔
سیمیولیٹر فنکشن مزید گہرا جاتی ہے۔ یہ صرف آپ کو یہ نہیں دکھاتی کہ کچھ ایسا لگتا ہے۔ یہ فزکس، سبب اور اثر، اور اشیاء کے وقت کے ساتھ ایک دوسرے سے تعامل کو ماڈل کرتی ہے۔ ایک رینڈرر آپ کو ایک گیند کو کنارے کی طرف لے جاتے ہوئے دکھا سکتا ہے۔ ایک سیمیولیٹر جانتی ہے کہ گیند گر جائے گی۔
پلانر فنکشن دنیا کے کام کرنے کے طریقے کو سیمولیٹر کی سمجھ کے ذریعے اقدامات کے منصوبے بناتا ہے۔ یہ ایک ایسے AI اور دوسرے AI کے درمیان فرق ہے جو ایک رستخوار کو صرف دیکھتا ہے اور وہ جو آپ کے لیے ایک سینڈوچ بنانے کا طریقہ نکال سکتا ہے بغیر کابینٹ میں ہر پلیٹ توڑے۔
یہ تین فنکشنز الگ الگ کام نہیں کرتے۔ لی کا مقالہ انہیں ایک مسلسل لوپ کے طور پر بیان کرتا ہے، جہاں ہر صلاحیت دوسریوں میں داخل ہوتی ہے اور انہیں مضبوط بناتی ہے۔ ایک رینڈرر سیمولیٹر کو ویژوئل سیکھنے کے بارے میں معلومات فراہم کرتا ہے، سیمولیٹر پلانر کو فزکس کے مطابق پیشگوئیاں فراہم کرتا ہے، اور پلانر کے مقاصد رینڈرر اور سیمولیٹر کو یہ طے کرنے میں مدد کرتے ہیں کہ وہ کس چیز کو ترجیح دیں۔
روبوٹکس کو اس کی اتنی ضرورت کیوں ہے
لی نے دلائل پیش کیے ہیں، جن میں نومبر 2025 کا ایک پہلے کا منیفیسٹ بھی شامل ہے، کہ عالمی ماڈلز شبیہہ اور حقیقت کے درمیان کے فرق کو پار کر سکتے ہیں۔ اگر آپ فزیکل دنیا کا ایک کافی درست ڈیجیٹل نقل تعمیر کر سکیں، تو روبوٹس پہلے وہاں تربیت حاصل کر سکتے ہیں۔
ورلڈ لیبز نے پہلے ہی اس نظریہ کو عملی شکل دینا شروع کر دیا ہے۔ کمپنی نے نومبر 2025 میں اپنا پہلا تجارتی مصنوعہ ماربل جاری کیا۔ ماربل متعدد ماڈل پرامپٹس سے مستقل، اعلیٰ درجہ کی 3D دنیاں تخلیق کرتا ہے، جس کا مطلب ہے کہ آپ متن، تصاویر یا دیگر ان پٹس کا استعمال کرکے ایک ماحول کی وضاحت کر سکتے ہیں، اور ماربل اس وضاحت سے ایک قابل گھومنے والی 3D جگہ تخلیق کرتا ہے۔ یہ نظام پہلے ہی روبوٹک شبیہ سازی ماحولوں میں استعمال ہو رہا ہے۔
ویڈیو کے برعکس، جو فریمز کا ایک مقررہ ترتیب ہوتا ہے، ماربل کے عالم میں آپ کے گزرنے کے ساتھ ساتھ جیومیٹری اور فزکس مستقل رہتی ہیں۔ ماربل کے ماحول میں تربیت پانے والا روبوٹ ایک ہی شیلف کو مختلف زاویوں سے قریب آ سکتا ہے اور ایک ہی پوزیشن میں ایک ہی چیزوں کو تلاش کر سکتا ہے۔
میشن کے پیچھے کا پیسہ
وورلڈ لیبز نے فروری 2026 میں 1 ارب ڈالر جمع کیے، جس نے پہلے 230 ملین ڈالر کے راؤنڈ کو مزید بڑھایا۔ سرمایہ کاروں کی فہرست میں AMD، Autodesk، NVIDIA اور Fidelity شامل ہیں۔
کل فنڈنگ کی رقم 1.23 ارب ڈالر ہے، جس سے ورلڈ لیبز کو ایک ایسی کمپنی کے طور پر درجہ دیا جاتا ہے جو بڑے زبانی ماڈل کے مقابلے کے بجائے سپیشل انٹیلی جنس پر توجہ مرکوز کرتی ہے۔
