数学 > 优化与控制
[提交于 2025年9月3日
]
标题: 多期资产负债管理在制度转换市场中的强化学习
标题: Multi-period Asset-liability Management with Reinforcement Learning in a Regime-Switching Market
摘要: 本文探讨了在具有状态转换动态和不可控负债的多期金融市场中的均值-方差投资组合选择问题。 为了应对金融市场中决策过程的不确定性,我们引入了强化学习(RL)技术。 具体而言,该研究考察了一个探索性均值-方差(EMV)框架,其中投资者在不完全市场信息下力求最小化风险并最大化收益,受经济状态变化的影响。 市场模型包括无风险资产和风险资产,负债动态由马尔可夫状态转换过程驱动。 为了符合现实世界中金融决策在离散时间周期内进行的情况,我们采用了一个多期动态模型。 我们提出了一种使用RL技术推导出的最优投资组合策略,该策略能够适应这些市场条件。 所提出的解决方案通过整合预先承诺策略公式,解决了经典均值-方差模型中的固有时变不一致性问题。 此外,我们引入了部分市场可观测性,采用随机滤波技术来估计不可观测的市场状态。 数值模拟和对真实金融数据的实证测试表明,与传统模型相比,我们的方法在获得更高收益、更低风险和更快收敛方面表现出色。 这些发现突显了我们的基于RL的解决方案在动态和复杂金融环境中的鲁棒性和适应性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.