电气工程与系统科学 > 系统与控制
[提交于 2022年12月1日
]
标题: 基于学习的终端成本预测控制使用近似值迭代
标题: Predictive Control with Learning-Based Terminal Costs Using Approximate Value Iteration
摘要: 模型预测控制(MPC)方案下的稳定性通常通过终端成分来保证。采用(控制)李雅普诺夫函数作为终端成本是一种常见选择。基于学习的方法可以用来通过将其与无限时域最优控制问题联系起来构建终端成本,在这种情况下,最优成本是一个李雅普诺夫函数。值迭代是一种近似动态规划(ADP)方法,指的是特定的成本近似技术。在这项工作中,我们将终端无约束预测控制的结果和近似值迭代结合起来,以从这两个领域中获得好处。根据不同的因素(如与逼近相关的误差)推导出预测时域,以使闭环渐近稳定,并允许与无限时域最优成本相比的次优性估计。该结果扩展了最近关于具有基于ADP终端成本的预测控制的研究,且不需要局部初始稳定控制器。我们在仿真中将此控制器与其他终端成本选项进行比较,以表明所提出的方法比先前的结果能实现更短的最小时域。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.