数学 > 优化与控制
[提交于 2025年2月18日
]
标题: 基于测度值HJB的贝叶斯最优自适应控制视角
标题: A measure-valued HJB perspective on Bayesian optimal adaptive control
摘要: 我们考虑一个贝叶斯自适应最优随机控制问题,其中隐藏的静态信号对噪声观测的漂移具有非可分离的影响。 允许控制这种依赖的具体形式,我们的目标是优化一个依赖于隐藏信号后验分布的成本泛函。 将此后验分布的动力学表达在观测过滤过程中,我们将问题嵌入到一个真正无限维的随机控制问题中,该问题涉及所谓的测度值鞅。 我们通过使用粘性理论和近似论证来解决这个问题。 具体来说,我们证明了与相应弱形式的等价性,以相关HJB方程的唯一连续粘性解来表征问题的最优值,并构造了一个分段常数且任意接近最优的控制来解决我们主要研究的问题。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.