根據動察 Beating 監測,小米汽車正式發布 Xiaomi EV World Model 輔助駕駛世界模型全新架構,首次在內部實現三維重建與視頻生成模組的深度耦合。在自動駕駛模擬中,傳統技術往往將重建與生成割裂。重建模組能還原場景但無法預測變化,生成模組雖能預測未來但長時序下容易失真漂移。團隊提出 JointWM 架構,以三維幾何結構作為物理骨架錨定場景,再通過生成模組補全視覺細節並預測未觀測區域,在 Waymo 和 nuScenes 等主流基準中刷新多項最佳性能紀錄。 具體機制上,重建模組 WorldRec 舍棄傳統逐像素範式,改用稀疏三維查詢點進行場景表徵,增量融合為跨視角 4D Gaussian 空間骨架,實現 10 秒快速重建 10 秒視頻。基於重建模組提供的幾何先驗,生成模組 WorldGen 受限於骨架物理邊界,只負責生成合理的光影與紋理。對於未來幀與視野盲區等邊界之外的內容,生成模組通過兩階段時序訓練與分佈匹配蒸餾機制進行物理預測。整個架構在 H20 GPU 上實現單視角 0.19 秒、三視角 0.46 秒的生成速度,並支援最長 1 分鐘的視頻生成。 這套方案在 Waymo 重建精度測試中取得 28.48 PSNR 成績,並在 nuScenes 零樣本泛化中保持領先。在生成效率上,方案比自迴歸基線 Epona 快 5.6 倍,時空連貫度在同類算法中位居前列。目前,研究成果已在小米汽車三大場景落地,包括交付超 10 萬段高質量合成數據用於感知模型訓練、構建高逼真閉環模擬環境複現長尾路況,以及上線輔助駕駛學堂以生成式視頻指導用戶操作。
小米推出 JointWM 框架用於自動駕駛,創下新基準紀錄
MarsBit分享






小米 EV 已推出 JointWM 自動駕駛框架,這是一種結合 3D 重建與影片生成的新模型。該框架在 Waymo 測試中達到 28.48 PSNR,並提升效率與連貫性,超越現有模型。真實世界資產(RWA)新聞強調其用於生成超過 100,000 個合成資料片段以進行訓練。此技術目前已應用於三個關鍵場景。新代幣上線仍是加密領域的獨立趨勢。
來源:顯示原文
免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。
虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款和風險披露 。