电气工程与系统科学 > 系统与控制
[提交于 2025年7月16日
]
标题: 神经协态调节器:一种具有输入约束的实时最优控制数据驱动范式
标题: Neural Co-state Regulator: A Data-Driven Paradigm for Real-time Optimal Control with Input Constraints
摘要: 我们提出了一种新颖的无监督学习框架,用于实时解决具有输入约束的非线性最优控制问题(OCPs)。 在此框架中,神经网络(NN)学习预测最优共状态轨迹,该轨迹在给定系统的任何状态下,基于庞特里亚金最小原理(PMP)使控制哈密顿量最小化。 具体而言,神经网络被训练以找到同时满足非线性系统动力学并最小化二次调节成本的范数最优共状态解。 然后通过求解二次规划(QP)从预测的最优共状态轨迹中提取控制输入,以满足输入约束和最优性条件。 我们创造了“神经共状态调节器”(NCR)这一术语来描述共状态神经网络和控制输入二次规划求解器的结合。 为了展示NCR的有效性,我们将它的反馈控制性能与专家非线性模型预测控制(MPC)求解器在单车模型上的性能进行了比较。 由于NCR的训练不依赖于通常次优的专家非线性控制求解器,因此即使在系统条件超出其原始训练域的情况下,NCR也能在收敛误差和输入轨迹平滑性方面优于非线性MPC求解器。 同时,NCR的计算时间比非线性MPC少两个数量级。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.