Fei-Fei Li ay naglalabas ng framework para sa mga world model sa robotics at gaming

Gusto ni Fei-Fei Li na malutas ang isang debate na nagpapalakas sa komunidad ng AI: ano nga ba ang totoong itinuturing na “world model” at ano ang simpleng fancy video generator na may lab coat.

Ang propesor ng Stanford at CEO ng World Labs ay nagpahayag ng “A Functional Taxonomy of World Models” noong Hunyo 3, 2026, na naglalayong magbigay ng isang framework na klasipikahin ang mga world model sa tatlong magkakaibang punsiyon: renderer, simulator, at planner. Ang papel ay nag-uugnay na ang tatlong papel na ito ay bumubuo ng isang interkonektadong loop na nagtataguyod ng ano ang tawag ni Li bilang “spatial intelligence,” ang uri ng AI na talagang nakakaintindi at nakakaintindihan sa mga pisikal na kapaligiran.

Tatlong trabaho, isang modelo

Ang renderer function ay nag-aangkop sa visual generation. Ito ay gumagawa ng mataas na kalidad na visual na mga representasyon mula sa mga data input. Ito ang ginagawa ng karamihan sa kasalukuyang “mga world model,” at nagpapakita si Li ng malinaw na argumento na ang mga sistema na nakakapit sa antas na ito ay hindi totoong mga world model.

Ang function ng simulator ay mas malalim. Hindi lang ito nagpapakita kung ano ang hitsura ng isang bagay. Ito ay nagmumodelo ng pisika, sanhi at epekto, at kung paano interaksyonin ng mga bagay sa paglipas ng panahon. Maaaring ipakita ng renderer ang isang bola na umiikot patungo sa dulo ng klawis. Alam ng simulator na babagsak ang bola.

Pamamahayag

Gumagamit ang planner function ng pag-unawa ng simulator kung paano gumagana ang mundo upang magtakda ng mga kurso ng aksyon. Ito ang pagkakaiba sa pagitan ng isang AI na nagmamasid sa isang kusina at isang AI na kayang malutas kung paano gawin ang isang sandwich para sa iyo nang hindi nasisiraan ang lahat ng plato sa kabinet.

Hindi gumagana ang tatlong punsiyon nang hihiwalay. Nagsasalaysay ang papel ni Li na bumubuo sila ng isang tuloy-tuloy na loop, kung saan bawat kakayahan ay nagpapadala at nagpapalakas sa isa’t isa. Nagbibigay ang renderer ng visual na konteksto sa simulator, nagbibigay ang simulator ng mga paghuhula na batay sa pisika sa planner, at binubuo ng mga layunin ng planner kung ano ang dapat prioritizahan ng renderer at simulator.

Bakit kailangan nang mabuti ng robotics ito

Si Li ay nagpapaliwanag, kabilang sa isang mas naunang manifesto noong Nobyembre 2025, na ang mga mundo model ay maaaring tulungan na tulayin ang pagkakaiba sa pagitan ng simulasyon at katotohanan. Kung maaari mong gawin ang sapat na akurat na digital na kopya ng pisikal na mundo, maaaring magtrabaho muna ang mga robot doon.

Kumukuha na ang World Labs ng pagsasagawa ng teoryang ito. Ipinakilala ng kumpanya ang Marble, ang kanilang unang komersyal na produkto, noong Nobyembre 2025. Gumagawa ang Marble ng patuloy at mataas na kalidad na 3D mga mundo mula sa multimodal na mga prompt, kaya maaari mong ilarawan ang isang kapaligiran gamit ang teksto, imahe, o iba pang input, at bubuo ang Marble ng isang navigable na 3D espasyo mula sa deskripsyon na iyon. Ginagamit na ang sistema sa mga robotic simulation environment.

Sa pagkakaiba sa isang video, na isang fixed na hanay ng mga frame, ang mga mundo ni Marble ay nagpapanatili ng magkakasunod na geometry at physics habang ikaw ay naglalakbay sa loob nito. Ang isang robot na nagtatrabaho sa isang Marble environment ay maaaring lumapit sa parehong shelf mula sa iba’t ibang angle at makahanap ng parehong mga bagay sa parehong position.

Ang pera sa likod ng misyon

Kumita ng $1 bilyon ang World Labs noong Pebrero 2026, na nagpapatuloy sa nakaraang pagsasama ng $230 milyon. Kasama sa listahan ng mga investor ang AMD, Autodesk, NVIDIA, at Fidelity.

Ang kabuuang pondo na $1.23 bilyon ay nagpapakilala sa World Labs bilang isang kakaibang kompanya para sa isang AI startup na nakatuon sa spatial intelligence kaysa sa labanan ng mga malalaking language model na naging pangunahing balita.