NVIDIA在 2024–2026 自动驾驶领域的主线工作

张开发
2026/4/17 17:58:13 15 分钟阅读

分享文章

NVIDIA在 2024–2026 自动驾驶领域的主线工作
NVIDIA 在 2024–2026 自动驾驶领域的主线工作。把范围限定为:端到端驾驶 / 推理、世界模型与仿真、数据与闭环训练、感知/地图/安全;纯通用 3D 重建或与自动驾驶关联较弱的论文不放进主表。另外,少数论文的arXiv 首发时间会早于正式发表/官方归档时间,我这里优先按正式年份或 NVIDIA 官方页年份归类,同时单列 arXiv。 (NVIDIA)1) 端到端驾驶 / 推理年份标题arXiv官方页核心说明来源2024PARA-Drive: Parallelized Architecture for Real-time Autonomous Driving未检到公开 arXivNVIDIA系统分析端到端模块化 AV stack 的设计空间,最后提出全并行架构 PARA-Drive,在保持可解释性与安全性的同时,把运行速度提升到接近3×。(NVIDIA)2024Driving Everywhere with Large Language Model Policy AdaptationarXiv:2402.05932NVIDIA AVG 列表提出用 LLM 读取本地驾驶手册与交通规则,帮助策略适配不同国家/地区的交通习惯与法规,是 NVIDIA 在“规则适配 + LLM 驾驶”方向很早的一篇代表作。(NVIDIA)2025Alpamayo 1 / Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long TailarXiv:2511.00088NVIDIA这是 NVIDIA 近两年自动驾驶 VLA 主线代表作:把Chain of Causation推理和轨迹规划结合起来,目标是提升长尾复杂场景中的决策、轨迹质量、安全性与车端实时性。(NVIDIA)2025Latent Chain-of-Thought World Modeling for End-to-End DrivingarXiv:2512.10226NVIDIA AVG提出Latent-CoT-Drive,不用自然语言显式思维链,而用动作对齐的 latent tokens 同时表达候选动作与未来世界结果,把“推理”和“决策”统一进同一隐空间。(NVIDIA)2026V2V-GoT: Vehicle-to-Vehicle Cooperative Autonomous Driving with Multimodal Large Language Models and Graph-of-ThoughtsarXiv:2509.18053NVIDIA Taiwan面向协同自动驾驶,把MLLM + Graph-of-Thoughts用到车车协同感知、预测与规划中,重点解决遮挡场景下的多车协同决策;官方页标注为ICRA 2026。(NVIDIA)2) 世界模型 / 仿真 / 闭环训练年份标题arXiv官方页核心说明来源2024Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World ModelsarXiv:2409.16663NVIDIA用 latent-space generative world model 缓解 imitation learning 的 covariate shift,让策略在训练阶段学会从偏离分布的状态中恢复,是 NVIDIA 自动驾驶世界模型线的重要起点。(NVIDIA)2024NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and BenchmarkingarXiv:2406.15349NVIDIA AVG提出介于开环评估和闭环仿真之间的non-reactive simulation范式,在真实数据上做大规模可复现实验,是 NVIDIA 近两年自动驾驶评测体系的关键基准工作。(NVIDIA)2025DreamDrive: Generative 4D Scene Modeling from Street View ImagesarXiv:2501.00601NVIDIA AVG 列表把视频生成先验与 4D 场景重建结合起来,从街景图像生成具有3D 一致性的动态驾驶场景与新视角视频,面向可控场景生成、仿真与下游感知/规划增强。(NVIDIA)2025Pseudo-Simulation for Autonomous DrivingarXiv:2506.04218NVIDIA AVG 列表提出 pseudo-simulation:仍在真实数据集上评估,但通过3D Gaussian Splatting预先合成潜在未来观测,尽量逼近闭环评测对误差累积与恢复能力的考察。(NVIDIA)2025ReSim: Reliable World Simulation for Autonomous DrivingarXiv:2506.09981NVIDIA AVG针对驾驶 world model 难以模拟危险/非专家行为的问题,把真实安全驾驶数据与模拟器中的非专家数据混合训练,得到更可控、更可靠的驾驶世界模型,并配套Video2Reward。(NVIDIA)3) 数据 / 编码效率 / 泛化年份标题arXiv官方页核心说明来源2025Data Scaling Laws for End-to-End Autonomous DrivingarXiv:2504.04338NVIDIA AVG系统研究端到端自动驾驶的数据 scaling law,在16–8192 小时内部数据上分析数据规模与开环/闭环表现之间的关系,是 NVIDIA 自动驾驶“数据驱动优先”路线的标志论文。(NVIDIA)2025Efficient Multi-Camera Tokenization with Triplanes for End-to-End DrivingarXiv:2506.12251—面向大模型驾驶策略的多摄像头输入压缩,提出 triplane-based tokenizer,在保持精度的同时让 token 数显著减少,闭环推理更快,更接近车端实时部署。(arXiv)2025

更多文章