计算机科学 > 机器人技术
[提交于 2025年7月14日
]
标题: 多残差专家混合学习在多车辆系统协同控制中的应用
标题: Multi-residual Mixture of Experts Learning for Cooperative Control in Multi-vehicle Systems
摘要: 自动驾驶车辆(AVs)正变得越来越受欢迎,其应用已不再仅仅是交通方式,而是作为交通流的移动执行器,以控制流体动力学。 这与传统的固定位置执行器(如交通信号灯)形成对比,并被称为拉格朗日交通控制。 然而,设计一种能够在各种交通场景中泛化的有效拉格朗日交通控制策略是一个重大挑战。 现实世界的交通环境高度多样化,开发在这些多样化交通场景中表现稳健的策略是具有挑战性的。 此外,由于交通系统的多智能体特性、参与者之间的混合动机以及受严格物理和外部约束的冲突优化目标,问题变得更加复杂。 为了解决这些挑战,我们引入了多残差专家学习(MRMEL),这是一种新的拉格朗日交通控制框架,它通过学习一个残差来增强给定的次优基准策略,同时明确考虑交通场景空间的结构。 具体而言,受到残差强化学习的启发,MRMEL通过学习一个残差校正来增强次优基准AV控制策略,但同时根据交通场景动态地从一组条件性基准策略中选择最合适的基准策略,并将其建模为专家混合模型。 我们使用亚特兰大、达拉斯-沃思堡和盐湖城信号交叉口的协同生态驾驶案例研究来验证MRMEL,采用真实世界数据驱动的交通场景。 结果表明,MRMEL在每个设置中都能持续实现优于最强基线的性能,相对于每个设置中的最强基线,整体车辆排放量额外减少了4%-9%。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.