Nvidia ने अभी तक का पहला ओपन ओमनी-मॉडल जारी किया है, जिसे भौतिक AI के लिए विशेष रूप से बनाया गया है। 31 मई को लॉन्च किया गया Cosmos 3, तर्क, विश्व निर्माण और क्रिया क्षमताओं को एकल प्रणाली में एकीकृत करता है, जिसे रोबोट और स्वायत्त वाहनों को वास्तविक दुनिया की उलझी हुई, अप्रत्याशित प्रकृति को समझने में मदद करने के लिए डिज़ाइन किया गया है।
Cosmos 3 टेक्स्ट, इमेज या वीडियो इनपुट के आधार पर अधिकतम 30 सेकंड के भविष्यवाणी वाले वीडियो अनुक्रम बना सकता है, जिससे एक रोबोट अपने वातावरण में अगला क्या होगा, इसकी कल्पना कर सकता है, बिना किसी एक्टुएटर को हिलाए।
Cosmos 3 वास्तव में क्या करता है
Cosmos 3, जिसे Nvidia एक Mixture of Transformers आर्किटेक्चर कहता है, एक साथ कई प्रकार के इनपुट को प्रोसेस करता है। यह मॉडल ध्वनि और क्रिया मोडालिटीज़ को सपोर्ट करता है, जिसका अर्थ है कि Cosmos 3 से सुसज्जित रोबोट अपने द्वारा देखे गए, सुने गए और किए गए कार्यों को एक समेकित ढांचे में प्रोसेस कर सकता है।
व्यावहारिक अनुप्रयोग रोबोट नीति अधिगम नामक कुछ पर केंद्रित है। कॉस्मोस 3, जिसे नविडिया वर्ल्ड एक्शन मॉडल्स या WAMs कहता है, उसके लिए एक आधार के रूप में कार्य करता है, जो सशरीर एजेंट्स को ऐसे परिवेशों में काम करने की अनुमति देता है जिन्हें वे पहले कभी नहीं देखा है।
2025 में रखे गए आधार पर निर्माण करना
Nvidia ने 2025 के दौरान कई पिछले संस्करण जारी किए, जिनमें भविष्यवाणी, ट्रांसफ़र लर्निंग और तर्क पर केंद्रित संस्करण शामिल थे। उन पिछले मॉडल्स ने पहले ही गंभीर ग्राहकों को आकर्षित किया है।
फिगर एआई, मानवरूप रोबोटिक्स कंपनी, ने अपने द्विपद रोबोट के लिए कॉस्मोस तकनीक को अपनाया। एजिलिटी रोबोटिक्स, एक अन्य मानवरूप खिलाड़ी, ने भी ऐसा ही किया। स्वयंचालित वाहन की ओर से, यूबर, वाबी और वेवे ने सभी अपने स्वयंचालित प्रयासों के लिए पिछले कॉस्मोस संस्करणों का उपयोग किया।
इसका निवेशकों और व्यापक बाजार के लिए क्या अर्थ है
विशेष रूप से रोबोटिक्स उद्योग के लिए, कॉस्मोस 3 की खुली प्रकृति छोटे प्रतिभागियों के बीच अपनाने को तेज कर सकती है, जिनके पास अपने खुद के विश्व मॉडल को शुरू से बनाने के लिए संसाधन नहीं होते। सिंथेटिक डेटा जनरेशन, जो मॉडल की मुख्य क्षमताओं में से एक है, रोबोटिक्स विकास में पारंपरिक रूप से सबसे बड़ी बाधा को सुलझाता है: महंगे हार्डवेयर को नष्ट किए बिना पर्याप्त वास्तविक-दुनिया की प्रशिक्षण डेटा प्राप्त करना।

