Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2507.11392

帮助 | 高级搜索

电气工程与系统科学 > 系统与控制

arXiv:2507.11392 (eess)
[提交于 2025年7月15日 ]

标题: 带约束松弛的逆最优控制

标题: Inverse Optimal Control with Constraint Relaxation

Authors:Rahel Rickenbach, Amon Lahr, Melanie N. Zeilinger
摘要: 逆最优控制(IOC)是一种有前景的范式,用于从能力演示者学习和模仿最优控制策略,或通过从一个或多个相应的最优控制序列中估计未知的目标函数来更深入地理解其意图。 在具有安全保持不等式约束的环境中计算演示的估计时,考虑到所选IOC方法中的这些约束是至关重要的,因为它们对最终控制策略有强烈影响。 然而,能够考虑不等式约束的解决方案策略,如逆Karush-Kuhn-Tucker方法,依赖于它们的正确激活和满足;当处理噪声演示时,这是一个限制性假设。 为了解决这个问题,我们利用了精确惩罚函数的概念进行IOC,并展示了估计精度的保持。 考虑到噪声演示,我们随后说明了惩罚函数的使用如何减少未知变量的数量,以及它们的近似如何增强估计方法在多面体约束环境中考虑错误约束激活的能力。 所提出的方法在三种系统中进行了仿真评估,优于传统松弛方法在噪声演示中的表现。
摘要: Inverse optimal control (IOC) is a promising paradigm for learning and mimicking optimal control strategies from capable demonstrators, or gaining a deeper understanding of their intentions, by estimating an unknown objective function from one or more corresponding optimal control sequences. When computing estimates from demonstrations in environments with safety-preserving inequality constraints, acknowledging their presence in the chosen IOC method is crucial given their strong influence on the final control strategy. However, solution strategies capable of considering inequality constraints, such as the inverse Karush-Kuhn-Tucker approach, rely on their correct activation and fulfillment; a restrictive assumption when dealing with noisy demonstrations. To overcome this problem, we leverage the concept of exact penalty functions for IOC and show preservation of estimation accuracy. Considering noisy demonstrations, we then illustrate how the usage of penalty functions reduces the number of unknown variables and how their approximations enhance the estimation method's capacity to account for wrong constraint activations within a polytopic-constrained environment. The proposed method is evaluated for three systems in simulation, outperforming traditional relaxation approaches for noisy demonstrations.
主题: 系统与控制 (eess.SY)
引用方式: arXiv:2507.11392 [eess.SY]
  (或者 arXiv:2507.11392v1 [eess.SY] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.11392
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Rahel Rickenbach [查看电子邮件]
[v1] 星期二, 2025 年 7 月 15 日 15:03:00 UTC (390 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
eess.SY
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.SY
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号