Nvidia, fiziksel AI için özel olarak geliştirilen ilk açık omni-modeli olarak adlandırdığı Cosmos 3'ü 31 Mayıs'ta tanıttı. Bu sistem, mantık yürütme, dünya oluşturma ve eylem yeteneklerini bir araya getirerek robotlara ve otonom araçlara karmaşık, öngörülemeyen gerçek dünyayı anlamalarında yardımcı olacak şekilde tasarlandı.
Cosmos 3, metin, görüntü veya video girdilerine dayalı olarak 30 saniyeye kadar tahmini video dizileri oluşturabilir; bu da bir robotun, bir aktüatörü harekete geçirmeden önce çevresinde ne olacağını "hayal etmesini" sağlar.
Cosmos 3'ün aslında ne yaptığını
Cosmos 3, Nvidia'nin Mixture of Transformers mimarisini kullanarak birden fazla türde girdiyi aynı anda işler. Model, ses ve eylem modalliklerini destekler; Cosmos 3 ile donatılmış bir robot, gördüğü, işittiği ve yaptığı şeyleri tek bir çerçeve içinde işleyebilir.
Pratik uygulama, robot politika öğrenmesi adı verilen bir şeye odaklanır. Cosmos 3, Nvidia'nın Dünya Eylem Modelleri veya WAM'lar olarak adlandırdığı şeyin temelini oluşturur ve gövdeli ajanların daha önce karşılaşmadıkları ortamlarda işlem yapmasını sağlar.
2025 yılında atılan temel üzerine inşa ediliyor
Nvidia, 2025 boyunca tahmin, aktarım öğrenmesi ve muhakeme odaklı varyantlar da dahil olmak üzere birkaç önceki versiyonu piyasaya sürdü. Bu daha önceki modeller, ciddi müşterileri zaten çekmişti.
İnsan benzeri robotik şirketi Figure AI, iki ayaklı robotları için Cosmos teknolojisini benimsedi. Başka bir insan benzeri oyuncu olan Agility Robotics da aynı şeyi yaptı. Otonom araç tarafında, Uber, Waabi ve Wayve, otonom sürüş çabaları için önceki Cosmos sürümlerinden yararlandı.
Bu, yatırımcılar ve daha geniş piyasa için ne anlama geliyor
Robotik endüstrisi için özellikle, Cosmos 3'ün açık yapısı, kendi dünya modellerini sıfırdan oluşturmak için kaynaklara sahip olmayan küçük oyuncular arasında benimsenmeyi hızlandırabilir. Modelin temel yeteneklerinden biri olan sentetik veri üretimi, robotik geliştirme sürecinde tarihsel olarak en büyük engel olan: pahalı donanımı zarar vermeden yeterli gerçek dünya eğitim verisi elde etme sorununu çözer.

