NVIDIA在 2024–2026 自动驾驶领域的主线工作

张开发

• 2026/4/17 17:58:13 • 15 分钟阅读

分享文章

NVIDIA 在 2024–2026 自动驾驶领域的主线工作。把范围限定为：端到端驾驶 / 推理、世界模型与仿真、数据与闭环训练、感知/地图/安全；纯通用 3D 重建或与自动驾驶关联较弱的论文不放进主表。另外，少数论文的arXiv 首发时间会早于正式发表/官方归档时间，我这里优先按正式年份或 NVIDIA 官方页年份归类，同时单列 arXiv。 (NVIDIA)1) 端到端驾驶 / 推理年份标题arXiv官方页核心说明来源2024PARA-Drive: Parallelized Architecture for Real-time Autonomous Driving未检到公开 arXivNVIDIA系统分析端到端模块化 AV stack 的设计空间，最后提出全并行架构 PARA-Drive，在保持可解释性与安全性的同时，把运行速度提升到接近3×。(NVIDIA)2024Driving Everywhere with Large Language Model Policy AdaptationarXiv:2402.05932NVIDIA AVG 列表提出用 LLM 读取本地驾驶手册与交通规则，帮助策略适配不同国家/地区的交通习惯与法规，是 NVIDIA 在“规则适配 + LLM 驾驶”方向很早的一篇代表作。(NVIDIA)2025Alpamayo 1 / Alpamayo-R1: Bridging Reasoning and Action Prediction for Generalizable Autonomous Driving in the Long TailarXiv:2511.00088NVIDIA这是 NVIDIA 近两年自动驾驶 VLA 主线代表作：把Chain of Causation推理和轨迹规划结合起来，目标是提升长尾复杂场景中的决策、轨迹质量、安全性与车端实时性。(NVIDIA)2025Latent Chain-of-Thought World Modeling for End-to-End DrivingarXiv:2512.10226NVIDIA AVG提出Latent-CoT-Drive，不用自然语言显式思维链，而用动作对齐的 latent tokens 同时表达候选动作与未来世界结果，把“推理”和“决策”统一进同一隐空间。(NVIDIA)2026V2V-GoT: Vehicle-to-Vehicle Cooperative Autonomous Driving with Multimodal Large Language Models and Graph-of-ThoughtsarXiv:2509.18053NVIDIA Taiwan面向协同自动驾驶，把MLLM + Graph-of-Thoughts用到车车协同感知、预测与规划中，重点解决遮挡场景下的多车协同决策；官方页标注为ICRA 2026。(NVIDIA)2) 世界模型 / 仿真 / 闭环训练年份标题arXiv官方页核心说明来源2024Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World ModelsarXiv:2409.16663NVIDIA用 latent-space generative world model 缓解 imitation learning 的 covariate shift，让策略在训练阶段学会从偏离分布的状态中恢复，是 NVIDIA 自动驾驶世界模型线的重要起点。(NVIDIA)2024NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and BenchmarkingarXiv:2406.15349NVIDIA AVG提出介于开环评估和闭环仿真之间的non-reactive simulation范式，在真实数据上做大规模可复现实验，是 NVIDIA 近两年自动驾驶评测体系的关键基准工作。(NVIDIA)2025DreamDrive: Generative 4D Scene Modeling from Street View ImagesarXiv:2501.00601NVIDIA AVG 列表把视频生成先验与 4D 场景重建结合起来，从街景图像生成具有3D 一致性的动态驾驶场景与新视角视频，面向可控场景生成、仿真与下游感知/规划增强。(NVIDIA)2025Pseudo-Simulation for Autonomous DrivingarXiv:2506.04218NVIDIA AVG 列表提出 pseudo-simulation：仍在真实数据集上评估，但通过3D Gaussian Splatting预先合成潜在未来观测，尽量逼近闭环评测对误差累积与恢复能力的考察。(NVIDIA)2025ReSim: Reliable World Simulation for Autonomous DrivingarXiv:2506.09981NVIDIA AVG针对驾驶 world model 难以模拟危险/非专家行为的问题，把真实安全驾驶数据与模拟器中的非专家数据混合训练，得到更可控、更可靠的驾驶世界模型，并配套Video2Reward。(NVIDIA)3) 数据 / 编码效率 / 泛化年份标题arXiv官方页核心说明来源2025Data Scaling Laws for End-to-End Autonomous DrivingarXiv:2504.04338NVIDIA AVG系统研究端到端自动驾驶的数据 scaling law，在16–8192 小时内部数据上分析数据规模与开环/闭环表现之间的关系，是 NVIDIA 自动驾驶“数据驱动优先”路线的标志论文。(NVIDIA)2025Efficient Multi-Camera Tokenization with Triplanes for End-to-End DrivingarXiv:2506.12251—面向大模型驾驶策略的多摄像头输入压缩，提出 triplane-based tokenizer，在保持精度的同时让 token 数显著减少，闭环推理更快，更接近车端实时部署。(arXiv)2025

更多文章

前端开发 2026/4/15 16:28:34

《QGIS快速入门与应用基础》280：地图框、图例、比例尺、指北针添加

8.1.4.2 地图框、图例、比例尺、指北针添加上一节我们完成了乡镇行政地图A4竖版标准布局的新建，搭建了符合政务规范的纸张框架；而本节要添加的地图框、图例、比例尺、指北针，是我国《测绘成果质量检查与验收》（GB/T 24356-2021）规定的正式地图必须具备的四大核心法定要素…

如何彻底解决电脑噪音和过热问题：Fan Control风扇控制的终极指南【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_T…

张开发

前端开发 2026/4/15 16:01:47

大麦网抢票神器：Python自动化脚本完整使用指南

大麦网抢票神器：Python自动化脚本完整使用指南【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 还在为抢不到心仪的演唱会门票而烦恼吗？大麦网抢票脚本…

张开发

NVIDIA在 2024–2026 自动驾驶领域的主线工作

最新文章

告别WinForm Chart卡顿：百万级数据流畅显示的懒加载与滚动条实战

MAVLink 飞控通讯协议实战：从零构建无人机通信系统

DeepMosaics终极指南：3步掌握AI智能马赛克处理技术

告别system_profiler：在Mac终端里用neofetch一键获取清晰美观的硬件信息

Axure8从零到精通的实战指南（附资源与技巧）

保姆级教程：在YOLOv11上实现剪枝、蒸馏与注意力机制（附完整代码）

推荐文章

手把手教你用NUCLEO-H743ZI2连接Arduino模块：从硬件选型到I2C通信实战

从‘能用’到‘好用’：我用这5个步骤，为我的智能小车电机选到了最合适的栅极驱动芯片

11.os模块、编解码、文件操作、try-except语句详解

公路车桥耦合振动程序（考虑路面不平整度）——两套模型介绍及操作指南

Umi-OCR完全指南：如何利用开源OCR工具实现高效文字识别

从理论到实践：基于MATLAB comm.RayTracingChannel的室内多径信道仿真全解析

相关文章

2025 AI写作革命：自定义API打造专属小说生成器

用GDAL和PyTorch搞定多光谱.tif图像训练Faster R-CNN（避坑全记录）

HC-SR501人体红外传感器：从参数解析到树莓派实战应用

2026年三维扫描仪选购指南：专业厂家如何选，这几点是关键

微信小程序项目目录结构优化指南：从tabBar报错看最佳实践

探索Feishin：打造个人专属的自托管音乐播放解决方案

分享文章

更多文章

《QGIS快速入门与应用基础》280：地图框、图例、比例尺、指北针添加

深入解析OpenCV中的cv::Scalar：从基础到实战应用

生成式AI变现进入“临界规模”窗口期：错过Q3，将丧失定价权与生态位卡位——6类企业必须立即启动的3步诊断法

GRE数据包深度解析：从封装结构到协议穿透

别再死记硬背了！用一张图+代码注释，带你搞懂AUTOSAR OS第一个Task的启动流程

GSE宏编辑器终极指南：5分钟快速掌握魔兽世界高级宏编写

3步掌握Blender化学品插件：从分子结构到3D打印的终极指南

告别TI官网迷路！手把手教你用C2000Ware为TMS320F28027搭建Proteus仿真工程模板

红杉：2025年企业数智化年度指南

2025年终极网盘直链提取神器：LinkSwift完整使用指南

如何彻底解决电脑噪音和过热问题：Fan Control风扇控制的终极指南

大麦网抢票神器：Python自动化脚本完整使用指南