定量金融 > 统计金融
[提交于 2024年12月23日
]
标题: 时间序列特征冗余悖论:基于抵押违约预测的实证研究
标题: Time Series Feature Redundancy Paradox: An Empirical Study Based on Mortgage Default Prediction
摘要: 随着机器学习在金融风险管理中的广泛应用,传统观点认为,更长的训练周期和更多的特征变量有助于提升模型性能。 本文聚焦于抵押贷款违约预测,实证发现了一种与传统认知相悖的现象:在时间序列预测中,增加训练数据的时间跨度和额外的非关键特征实际上会导致预测效果显著恶化。 利用房利美(Fannie Mae)的抵押贷款数据,研究通过比较不同时间窗口长度(如2012-2022年)以及特征组合下的预测表现,揭示出较短的时间窗口(如单一年度期间)搭配精心挑选的关键特征能够获得更优的预测结果。 实验结果表明,延长的时间跨度可能会引入历史数据中的噪声及过时的市场模式,而过多的非关键特征会干扰模型对核心违约因素的学习。 这项研究不仅挑战了数据建模中传统的“越多越好”观念,还为金融风险预测中的特征选择与时间窗口优化提供了新的见解和实用指导。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.