计算机科学 > 机器人技术
[提交于 2025年7月2日
]
标题: 基于大语言模型的现实安全关键驾驶视频生成
标题: LLM-based Realistic Safety-Critical Driving Video Generation
摘要: 设计多样且安全关键的驾驶场景对于评估自动驾驶系统至关重要。 在本文中,我们提出了一种新框架,利用大型语言模型(LLMs)进行少量样本代码生成,以在CARLA模拟器中自动合成驾驶场景,该模拟器在场景脚本方面具有灵活性,能够高效地基于代码控制交通参与者,并实施真实的物理动力学。 给定几个示例提示和代码样本,LLM会生成涉及交通参与者行为和位置的安全关键场景脚本,特别关注碰撞事件。 为了弥合仿真与现实外观之间的差距,我们集成了使用Cosmos-Transfer1和ControlNet的视频生成管道,将渲染的场景转换为逼真的驾驶视频。 我们的方法实现了可控的场景生成,并促进了罕见但关键的边缘案例的创建,例如遮挡下的行人横穿或突然的车辆切入。 实验结果表明,我们的方法在生成广泛、多样且安全关键的场景方面是有效的,为自动驾驶汽车的基于仿真的测试提供了一个有前景的工具。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.