Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > math > arXiv:2510.17339

帮助 | 高级搜索

数学 > 优化与控制

arXiv:2510.17339 (math)
[提交于 2025年10月20日 ]

标题: 通过投影到全局最小值器来评估逆最优控制的基础函数集的质量

标题: Assessing the Quality of a Set of Basis Functions for Inverse Optimal Control via Projection onto Global Minimizers

Authors:Filip Bečanović, Jared Miller, Vincent Bonnet, Kosta Jovanović, Samer Mohammed
摘要: 逆优化(逆最优控制)是推断一个成本函数的任务,使得给定的测试点(轨迹)相对于发现的成本是(几乎)最优的。 逆优化中的先验方法假设真实成本是凸基函数集合的凸组合,并且该基与测试点是一致的。 然而,在许多应用中,数据生成的原则并不明确,因此一致性假设并不总是合理的。 这项工作提出使用测试点与由凸基函数的凸组合生成的全局最优集之间的距离,作为衡量基函数相对于测试点表达质量的指标。 较大的最小距离会否定基函数集。 引入了全局最优集的概念,并在无约束和有约束的情况下探索了其性质。 在凸二次情况下,通过双层梯度下降和增强的线性矩阵不等式分别实现了最小距离的上下界。 该框架的扩展包括最大可表示基函数、非凸基函数(局部极小值)以及应用多项式优化技术。
摘要: Inverse optimization (Inverse optimal control) is the task of imputing a cost function such that given test points (trajectories) are (nearly) optimal with respect to the discovered cost. Prior methods in inverse optimization assume that the true cost is a convex combination of a set of convex basis functions and that this basis is consistent with the test points. However, the consistency assumption is not always justified, as in many applications the principles by which the data is generated are not well understood. This work proposes using the distance between a test point and the set of global optima generated by the convex combinations of the convex basis functions as a measurement for the expressive quality of the basis with respect to the test point. A large minimal distance invalidates the set of basis functions. The concept of a set of global optima is introduced and its properties are explored in unconstrained and constrained settings. Upper and lower bounds for the minimum distance in the convex quadratic setting are implemented by bi-level gradient descent and an enriched linear matrix inequality respectively. Extensions to this framework include max-representable basis functions, nonconvex basis functions (local minima), and applying polynomial optimization techniques.
评论: 8页,4图
主题: 优化与控制 (math.OC) ; 系统与控制 (eess.SY)
引用方式: arXiv:2510.17339 [math.OC]
  (或者 arXiv:2510.17339v1 [math.OC] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.17339
通过 DataCite 发表的 arXiv DOI
期刊参考: 2022 IEEE 61st Conference on Decision and Control (CDC), Cancun, Mexico, 2022, pp. 7598-7605
相关 DOI: https://doi.org/10.1109/CDC51059.2022.9993342
链接到相关资源的 DOI

提交历史

来自: Filip Becanovic [查看电子邮件]
[v1] 星期一, 2025 年 10 月 20 日 09:32:21 UTC (1,132 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
查看许可
当前浏览上下文:
eess
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
cs
cs.SY
eess.SY
math
math.OC

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号