Xiaomi、自動運転用JointWMフレームワークを発表し、新基準レコードを設定

icon MarsBit
共有
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon概要

expand icon
Xiaomi EVは、3D再構築と動画生成を組み合わせた新しい自動運転フレームワーク「JointWM」を発表しました。このフレームワークはWaymoのテストで28.48のPSNRを達成し、既存のモデルよりも効率性と一貫性を向上させています。リアルワールドアセット(RWA)のニュースでは、この技術がトレーニング用に10万以上の合成データセグメントを生成するために使用されていることが注目されています。この技術は現在、3つの主要なシナリオで稼働しています。新規トークンの上場は、暗号資産分野では別のトレンドとして続いています。

動察 Beating の監視によると、小米汽車は正式に「Xiaomi EV World Model」補助運転ワールドモデルの新フレームワークを発表し、初めて3次元再構築と動画生成モジュールの深層結合を内部で実現した。自動運転シミュレーションにおいて、従来の技術は再構築と生成を分離していた。再構築モジュールはシーンを再現できるが変化を予測できず、生成モジュールは未来を予測できるが長時間系列で歪みやドリフトが発生しやすかった。同チームはJointWMアーキテクチャを提案し、3次元幾何構造を物理的骨格としてシーンを固定し、生成モジュールで視覚的詳細を補完し未観測領域を予測する。WaymoやnuScenesなどの主要ベンチマークで複数の最良性能記録を更新した。 具体的なメカニズムでは、再構築モジュールWorldRecは従来のピクセル単位のアプローチを廃止し、疎な3次元クエリポイントを用いてシーンを表現し、跨視角4Dガウシアン空間骨格として増分的に統合することで、10秒の動画を10秒で高速再構築する。再構築モジュールが提供する幾何学的事前情報に基づき、生成モジュールWorldGenは骨格の物理的境界に制約され、合理的な影とテクスチャの生成に専念する。未来フレームや視野の死角などの境界外のコンテンツについては、生成モジュールが2段階の時系列トレーニングと分布マッチング蒸留メカニズムを用いて物理的予測を行う。このアーキテクチャはH20 GPU上で単視点0.19秒、三視点0.46秒の生成速度を実現し、最長1分の動画生成をサポートする。 このソリューションはWaymoの再構築精度テストで28.48 PSNRを達成し、nuScenesのゼロショット汎化でもリードを維持している。生成効率面では、自己回帰ベースラインEponaより5.6倍高速であり、時空間的一貫性は同種アルゴリズムの中でトップクラスである。現在、この研究成果は小米汽車の3つの主要シナリオに実装されており、感知モデルのトレーニング用に10万件以上の高品質合成データを提供し、高忠実度のクローズドループシミュレーション環境を構築してロングテール道路状況を再現し、ジェネレーティブ動画によるユーザー操作ガイドとして補助運転アカデミーを立ち上げた。

免責事項: 本ページの情報はサードパーティからのものであり、必ずしもKuCoinの見解や意見を反映しているわけではありません。この内容は一般的な情報提供のみを目的として提供されており、いかなる種類の表明や保証もなく、金融または投資助言として解釈されるものでもありません。KuCoinは誤記や脱落、またはこの情報の使用に起因するいかなる結果に対しても責任を負いません。 デジタル資産への投資にはリスクが伴います。商品のリスクとリスク許容度をご自身の財務状況に基づいて慎重に評価してください。詳しくは利用規約およびリスク開示を参照してください。