计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月5日
]
标题: 打破模仿瓶颈:强化扩散推动多样化轨迹生成
标题: Breaking Imitation Bottlenecks: Reinforced Diffusion Powers Diverse Trajectory Generation
摘要: 大多数端到端自动驾驶方法依赖于从单一专家演示中进行模仿学习,这通常导致保守和同质的行为,限制了在复杂现实场景中的泛化能力。 在本工作中,我们提出了DIVER,一个集成强化学习与基于扩散生成的端到端驾驶框架,以生成多样且可行的轨迹。 DIVER的核心是一个强化的基于扩散生成机制。 首先,该模型根据地图元素和周围代理生成多个参考轨迹,这些轨迹来源于单一的真实轨迹,缓解了仅依赖单一专家演示时模仿学习带来的局限性。 其次,使用强化学习来引导扩散过程,其中基于奖励的监督在生成的轨迹上施加安全性和多样性约束,从而提高其实用性和泛化能力。 此外,为了解决基于L2的开环指标在捕捉轨迹多样性方面的局限性,我们提出了一种新的多样性度量标准,用于评估多模式预测的多样性。 在闭环NAVSIM和Bench2Drive基准以及开环nuScenes数据集上的大量实验表明,DIVER显著提高了轨迹多样性,有效解决了模仿学习固有的模式崩溃问题。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.