Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > math > arXiv:2509.03251

帮助 | 高级搜索

数学 > 优化与控制

arXiv:2509.03251 (math)
[提交于 2025年9月3日 ]

标题: 多期资产负债管理在制度转换市场中的强化学习

标题: Multi-period Asset-liability Management with Reinforcement Learning in a Regime-Switching Market

Authors:Zhongqin Gao, Ping Chen, Xun Li, Yan Lv, Wenhao Zhang
摘要: 本文探讨了在具有状态转换动态和不可控负债的多期金融市场中的均值-方差投资组合选择问题。 为了应对金融市场中决策过程的不确定性,我们引入了强化学习(RL)技术。 具体而言,该研究考察了一个探索性均值-方差(EMV)框架,其中投资者在不完全市场信息下力求最小化风险并最大化收益,受经济状态变化的影响。 市场模型包括无风险资产和风险资产,负债动态由马尔可夫状态转换过程驱动。 为了符合现实世界中金融决策在离散时间周期内进行的情况,我们采用了一个多期动态模型。 我们提出了一种使用RL技术推导出的最优投资组合策略,该策略能够适应这些市场条件。 所提出的解决方案通过整合预先承诺策略公式,解决了经典均值-方差模型中的固有时变不一致性问题。 此外,我们引入了部分市场可观测性,采用随机滤波技术来估计不可观测的市场状态。 数值模拟和对真实金融数据的实证测试表明,与传统模型相比,我们的方法在获得更高收益、更低风险和更快收敛方面表现出色。 这些发现突显了我们的基于RL的解决方案在动态和复杂金融环境中的鲁棒性和适应性。
摘要: This paper explores the mean-variance portfolio selection problem in a multi-period financial market characterized by regime-switching dynamics and uncontrollable liabilities. To address the uncertainty in the decision-making process within the financial market, we incorporate reinforcement learning (RL) techniques. Specifically, the study examines an exploratory mean-variance (EMV) framework where investors aim to minimize risk while maximizing returns under incomplete market information, influenced by shifting economic regimes. The market model includes risk-free and risky assets, with liability dynamics driven by a Markov regime-switching process. To align with real-world scenarios where financial decisions are made over discrete time periods, we adopt a multi-period dynamic model. We present an optimal portfolio strategy derived using RL techniques that adapt to these market conditions. The proposed solution addresses the inherent time inconsistency in classical mean-variance models by integrating a pre-committed strategy formulation. Furthermore, we incorporate partial market observability, employing stochastic filtering techniques to estimate unobservable market states. Numerical simulations and empirical tests on real financial data demonstrate that our method achieves superior returns, lower risk, and faster convergence compared to traditional models. These findings highlight the robustness and adaptability of our RL-based solution in dynamic and complex financial environments.
评论: 40页,5图
主题: 优化与控制 (math.OC) ; 概率 (math.PR)
MSC 类: 91B28, 93E11, 93E20
引用方式: arXiv:2509.03251 [math.OC]
  (或者 arXiv:2509.03251v1 [math.OC] 对于此版本)
  https://doi.org/10.48550/arXiv.2509.03251
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Zhongqin Gao [查看电子邮件]
[v1] 星期三, 2025 年 9 月 3 日 12:10:49 UTC (542 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
math.OC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-09
切换浏览方式为:
math
math.PR

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号