Fei-Fei Li, Robotik ve Oyunlarda Dünya Modelleri İçin Çerçeve Yayınlıyor

Fei-Fei Li, AI topluluğunda uzun süredir süren bir tartışmayı çözmek istiyor: gerçekten bir “dünya modeli” neye denir ve sadece bir laboratuvar önlüğü giymiş şık bir video üretici mi?

Stanford profesörü ve World Labs CEO'su, 3 Haziran 2026'da "Dünya Modellerinin Fonksiyonel Bir Taksonomisi" adlı makaleyi yayımladı ve dünya modellerini üç ayrı fonksiyona: renderleyici, simülatör ve planlayıcı olarak sınıflandıran bir çerçeve sundu. Makale, bu üç rolün, Li'nin "uzamsal zeka" olarak adlandırdığı, fiziksel ortamları anlayabilen ve etkileşimde bulunabilen AI türünü temel alan bir döngü oluşturduğunu savunuyor.

Üç iş, bir model

Renderleyici işlevi görsel üretimi yönetir. Veri girdilerinden yüksek doğrulukta görsel temsiller oluşturur. Bu, şu anki çoğu “dünya modelinin” aslında yaptığı şeydir ve Li, bu seviyede takılı kalan sistemlerin gerçek dünya modelleri olmadığını güçlü bir şekilde savunur.

Simülatör işlevi daha derinlere iner. Sadece bir şeyin nasıl göründüğünü göstermez. Fizik, neden-sonuç ilişkisini ve nesnelerin zamanla nasıl etkileştiğini modeller. Bir render, bir topun bir uçurum kenarına doğru yuvarlandığını gösterebilir. Bir simülatör ise topun düşeceğini bilir.

Reklam

Planlayıcı işlevi, dünyanın nasıl çalıştığını simülatörün anlayışını kullanarak eylem rotaları çizer. Bir mutfakı izleyen bir yapay zeka ile dolapta bulunan her tabağı kırmeden sana bir sandviç yapmayı anlayan bir yapay zeka arasındaki farktır.

Bu üç işlev ayrı ayrı çalışmaz. Li’nin makalesi, her bir yeteneğin diğerlerine katkıda bulunduğunu ve güçlendirdiğini açıklayan sürekli bir döngü oluşturduğunu belirtir. Bir renderleyici, simülatöre görsel bağlam hakkında bilgi verir, simülatör, planlayıcıya fiziksel temelli tahminler sağlar ve planlayıcının hedefleri, renderleyicinin ve simülatörün önceliklendirmesi gerekenleri şekillendirir.

Robotik neden bu kadar çok ihtiyaç duyuyor

Li, Kasım 2025'te yayınlanan daha önceki bir manifestoda da dahil olmak üzere, dünya modellerinin simülasyon ile gerçeklik arasındaki boşluğu kapayabileceğini savunmuştur. Fiziksel dünyanın yeterince doğru bir dijital kopyasını oluşturabilirseniz, robotlar önce orada eğitim alabilir.

World Labs, bu teoriyi uygulamaya zaten başlamıştır. Şirket, Kasım 2025'te ilk ticari ürünü olan Marble'ı piyasaya sürdü. Marble, çok modlu talimatlarla kalıcı, yüksek çözünürlüklü 3D dünyalar oluşturur; bu da bir ortamı metin, resim veya diğer girdilerle tanımlayabileceğiniz ve Marble'ın bu tanımdan navigasyonlu bir 3D uzay oluşturabileceğiniz anlamına gelir. Sistem zaten robotik simülasyon ortamlarında kullanılmaktadır.

Bir video sabit bir kare dizisidir, ancak Marble’ın dünyaları, içinde hareket ettikçe geometri ve fizik kurallarını korur. Bir robot, Marble ortamında aynı rafı farklı açılardan yaklaşabilir ve aynı nesneleri aynı pozisyonlarda bulabilir.

Misyonun arkasındaki para

World Labs, Şubat 2026'da önceki 230 milyon dolarlık sermaye toplama turunu takip ederek 1 milyar dolar topladı. Yatırımcı listesinde AMD, Autodesk, NVIDIA ve Fidelity yer alıyor.

Toplam 1,23 milyar dolarlık finansman, World Labs'ı büyük dil modelleri yarışına odaklanan yerine uzamsal zekâya odaklanan bir AI startup olarak nadir bir gruba dahil ediyor.