تطلق شاومي إطار عمل JointWM للقيادة الذاتية، وتحدد سجلات معيارية جديدة

icon MarsBit
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
أطلقت Xiaomi EV إطار عمل JointWM للقيادة الذاتية، وهو نموذج جديد يجمع بين إعادة البناء ثلاثية الأبعاد وتوليد الفيديو. ويحقق الإطار عملًا بقيمة 28.48 PSNR في اختبارات Waymo، ويعزز الكفاءة والاتساق مقارنة بالنمذجات الحالية. وتشير أخبار الأصول الواقعية (RWA) إلى استخدامه في توليد أكثر من 100,000 قطعة بيانات اصطناعية للتدريب. والآن يعمل هذا التكنولوجيا في ثلاثة سيناريوهات رئيسية. وتظل قوائم الرموز الجديدة اتجاهًا منفصلًا في مجال التشفير.

وفقًا لمراقبة Beating، أطلقت Xiaomi رسميًا إطار عمل "Xiaomi EV World Model" للقيادة المساعدة، وهو أول إطار يحقق دمجًا عميقًا بين وحدتي إعادة البناء ثلاثية الأبعاد وتوليد الفيديو داخل الشركة. في محاكاة القيادة الذاتية، تفصل التقنيات التقليدية بين إعادة البناء والتوليد؛ فوحدة إعادة البناء قادرة على استعادة المشهد ولكنها غير قادرة على التنبؤ بالتغيرات، بينما تتمكن وحدة التوليد من التنبؤ بالمستقبل لكنها تعاني من انحراف وتشويه على المدى الطويل. وقد طور الفريق بنية "JointWM" التي تستخدم البنية الهندسية ثلاثية الأبعاد كهيكل فيزيائي يثبت المشهد، ثم تكمل وحدة التوليد التفاصيل البصرية وتتنبأ بالمناطق غير المرئية، محققةً سجلات أداء قياسية جديدة على معايير رائدة مثل Waymo وnuScenes. من الناحية الميكانيكية، تتخلى وحدة إعادة البناء "WorldRec" عن النموذج التقليدي القائم على البكسلات، وتستخدم نقاط استعلام ثلاثية الأبعاد نادرة لتمثيل المشهد، وتدمجها تدريجيًا كهيكل فضائي 4D Gaussian عبر زوايا متعددة، مما يتيح إعادة بناء فيديو مدته 10 ثوانٍ في 10 ثوانٍ فقط. وباستخدام المعرفة الهندسية التي توفرها وحدة إعادة البناء، تقتصر وحدة التوليد "WorldGen" على الحدود الفيزيائية للهيكل، وتتولى فقط توليد الإضاءة والملمس المنطقيين. أما للمحتوى خارج الحدود، مثل الإطارات المستقبلية أو المناطق العمياء، فتستخدم وحدة التوليد آلية تدريب زمني مراحلين وآلية تقطيع مطابقة التوزيع للتنبؤ الفيزيائي. وتحقق هذه البنية بأكملها سرعة توليد قدرها 0.19 ثانية للزاوية الواحدة و0.46 ثانية للزوايا الثلاث على وحدة H20 GPU، مع دعم توليد فيديو يصل طوله إلى دقيقة واحدة. حققت هذه الخطة نتيجة PSNR قدرها 28.48 في اختبارات إعادة البناء على Waymo، وحافظت على تفوقها في التعميم الصفري على nuScenes. من حيث كفاءة التوليد، فإن هذه الخطة أسرع بـ5.6 مرة من النموذج الأساسي التكراري Epona، كما أنها من بين الأعلى في الاستمرارية المكانية والزمنية مقارنة بالخوارزميات المماثلة. حاليًا، تم تطبيق هذه النتائج البحثية في ثلاثة سيناريوهات رئيسية لسيارات Xiaomi، بما في ذلك توفير أكثر من 100,000 مقطع بيانات مُولَّدة عالية الجودة لتدريب نماذج الإدراك، وبناء بيئة محاكاة مغلقة عالية الواقعية لاستنساخ حالات القيادة النادرة، وإطلاق "مدرسة القيادة المساعدة" لتوجيه المستخدمين عبر الفيديوهات المولدة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.