Xiaomi запускает框架 JointWM для автономного вождения, устанавливая новые рекорды производительности

icon MarsBit
Поделиться
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconСводка

expand icon
Xiaomi EV запустила框架 JointWM для автономного вождения — новую модель, объединяющую 3D-реконструкцию и генерацию видео. Фреймворк показал 28,48 PSNR в тестах Waymo и улучшил эффективность и согласованность по сравнению с существующими моделями. Новости о реальных активных активах (RWA) подчеркивают его использование для генерации более 100 000 синтетических фрагментов данных для обучения. Технология уже активна в трех ключевых сценариях. Новые листинги токенов остаются отдельной тенденцией в крипто-пространстве.

Согласно наблюдениям Beating, Xiaomi официально представила новую архитектуру вспомогательной системы вождения Xiaomi EV World Model, впервые реализовав глубокую интеграцию модулей трехмерного восстановления и генерации видео внутри системы. В традиционных технологиях симуляции автономного вождения восстановление и генерация часто разделяются: модуль восстановления может воссоздать сцену, но не способен предсказать изменения, тогда как модуль генерации может предсказывать будущее, но страдает от искажений и дрейфа при длительных временных интервалах. Команда предложила архитектуру JointWM, использующую трехмерную геометрическую структуру в качестве физического каркаса для закрепления сцены, а затем дополняющую визуальные детали и предсказывающую невидимые области с помощью модуля генерации. Эта архитектура установила новые рекорды производительности на основных эталонных наборах данных, таких как Waymo и nuScenes. В конкретной реализации модуль восстановления WorldRec отказывается от традиционного пиксельного подхода и использует разреженные трехмерные запросы для представления сцены, постепенно объединяя их в четырехмерную пространственную структуру на основе 4D Gaussian, что позволяет воссоздать 10-секундное видео за 10 секунд. Опираясь на геометрические априорные данные от модуля восстановления, модуль генерации WorldGen ограничен физическими границами каркаса и отвечает исключительно за генерацию реалистичного освещения и текстур. Для содержимого за пределами текущего кадра и слепых зон модуль генерации применяет двухэтапное временное обучение и механизм дистилляции на основе соответствия распределений для физически обоснованных предсказаний. Вся архитектура достигает скорости генерации 0,19 секунды на один ракурс и 0,46 секунды на три ракурса на GPU H20, поддерживая генерацию видео до 1 минуты. Эта система показала результат 28,48 PSNR при тестировании точности восстановления на Waymo и сохранила лидерство при нулевой выборке обобщения на nuScenes. По эффективности генерации она опережает авторегрессивную базовую модель Epona в 5,6 раза и занимает ведущие позиции по пространственно-временной согласованности среди аналогичных алгоритмов. В настоящее время данное решение уже внедрено в трех ключевых сценариях Xiaomi Auto: более чем 100 000 высококачественных синтетических данных переданы для обучения моделей восприятия, создана высокодетализированная замкнутая симуляционная среда для воспроизведения редких дорожных ситуаций, а также запущена образовательная платформа для вспомогательного вождения с использованием генеративных видео для инструктажа пользователей.

Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации. Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.