根據 Forklog 的報導,Nvidia 在聖地亞哥舉辦的 NeurIPS AI 會議上宣布了 Alpamayo-R1,一款用於自動駕駛的開源視覺推理語言模型。該模型基於 Cosmos-Reason 框架,能夠讓車輛處理文本和圖像以進行駕駛決策。Nvidia 強調,先前的自動駕駛模型在處理複雜場景(例如多車道交叉路口或雙排停車車輛)時存在困難,而 Alpamayo-R1 旨在為自動駕駛車輛提供類似人類常識的能力,以實現更安全的導航。該模型已可在 GitHub 和 Hugging Face 平台獲得,並附有 Cosmos Cookbook 的支援資源。此外,Nvidia 還展示了其他基於 Cosmos 的解決方案,包括 LidarGen 和 ProtoMotions3,並強調其進軍物理 AI 和機器人技術的努力,其中包括 Jetson AGX Thor 模塊的推進。

