计算机科学 > 机器学习
[提交于 2025年7月2日
]
标题: 神经哈密顿算子
标题: Neural Hamiltonian Operator
摘要: 高维随机控制问题由于维度灾难而难以解决。 传统动态规划的一种替代方法是庞特里亚金最大原理(PMP),它将问题重新表述为前向-后向随机微分方程(FBSDEs)系统。 在本文中,我们通过定义一个\textbf{神经哈密顿算子(NHO)}来引入一种形式框架,以深度学习解决此类问题。 该算子通过神经网络参数化耦合的FBSDE动力学,这些神经网络表示反馈控制和价值函数空间梯度的假设。 我们展示了如何通过训练底层网络来强制执行由PMP规定的相容性条件,从而找到最优的NHO。 通过采用这种算子理论观点,我们将深度FBSDE方法置于统计推断的严格语言中,将其视为从模拟数据中学习未知算子的问题。 这一视角使我们能够在一般的鞅驱动条件下证明NHO的通用逼近能力,并为分析此类模型固有的重大优化挑战提供了清晰的视角。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.