Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.09836

帮助 | 高级搜索

计算机科学 > 机器人技术

arXiv:2507.09836 (cs)
[提交于 2025年7月14日 ]

标题: 多残差专家混合学习在多车辆系统协同控制中的应用

标题: Multi-residual Mixture of Experts Learning for Cooperative Control in Multi-vehicle Systems

Authors:Vindula Jayawardana, Sirui Li, Yashar Farid, Cathy Wu
摘要: 自动驾驶车辆(AVs)正变得越来越受欢迎,其应用已不再仅仅是交通方式,而是作为交通流的移动执行器,以控制流体动力学。 这与传统的固定位置执行器(如交通信号灯)形成对比,并被称为拉格朗日交通控制。 然而,设计一种能够在各种交通场景中泛化的有效拉格朗日交通控制策略是一个重大挑战。 现实世界的交通环境高度多样化,开发在这些多样化交通场景中表现稳健的策略是具有挑战性的。 此外,由于交通系统的多智能体特性、参与者之间的混合动机以及受严格物理和外部约束的冲突优化目标,问题变得更加复杂。 为了解决这些挑战,我们引入了多残差专家学习(MRMEL),这是一种新的拉格朗日交通控制框架,它通过学习一个残差来增强给定的次优基准策略,同时明确考虑交通场景空间的结构。 具体而言,受到残差强化学习的启发,MRMEL通过学习一个残差校正来增强次优基准AV控制策略,但同时根据交通场景动态地从一组条件性基准策略中选择最合适的基准策略,并将其建模为专家混合模型。 我们使用亚特兰大、达拉斯-沃思堡和盐湖城信号交叉口的协同生态驾驶案例研究来验证MRMEL,采用真实世界数据驱动的交通场景。 结果表明,MRMEL在每个设置中都能持续实现优于最强基线的性能,相对于每个设置中的最强基线,整体车辆排放量额外减少了4%-9%。
摘要: Autonomous vehicles (AVs) are becoming increasingly popular, with their applications now extending beyond just a mode of transportation to serving as mobile actuators of a traffic flow to control flow dynamics. This contrasts with traditional fixed-location actuators, such as traffic signals, and is referred to as Lagrangian traffic control. However, designing effective Lagrangian traffic control policies for AVs that generalize across traffic scenarios introduces a major challenge. Real-world traffic environments are highly diverse, and developing policies that perform robustly across such diverse traffic scenarios is challenging. It is further compounded by the joint complexity of the multi-agent nature of traffic systems, mixed motives among participants, and conflicting optimization objectives subject to strict physical and external constraints. To address these challenges, we introduce Multi-Residual Mixture of Expert Learning (MRMEL), a novel framework for Lagrangian traffic control that augments a given suboptimal nominal policy with a learned residual while explicitly accounting for the structure of the traffic scenario space. In particular, taking inspiration from residual reinforcement learning, MRMEL augments a suboptimal nominal AV control policy by learning a residual correction, but at the same time dynamically selects the most suitable nominal policy from a pool of nominal policies conditioned on the traffic scenarios and modeled as a mixture of experts. We validate MRMEL using a case study in cooperative eco-driving at signalized intersections in Atlanta, Dallas Fort Worth, and Salt Lake City, with real-world data-driven traffic scenarios. The results show that MRMEL consistently yields superior performance-achieving an additional 4%-9% reduction in aggregate vehicle emissions relative to the strongest baseline in each setting.
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI); 机器学习 (cs.LG); 多智能体系统 (cs.MA); 系统与控制 (eess.SY)
引用方式: arXiv:2507.09836 [cs.RO]
  (或者 arXiv:2507.09836v1 [cs.RO] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.09836
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Vindula Jayawardana [查看电子邮件]
[v1] 星期一, 2025 年 7 月 14 日 00:17:12 UTC (8,588 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.RO
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.AI
cs.LG
cs.MA
cs.SY
eess
eess.SY

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号