定量金融 > 统计金融
[提交于 2025年3月5日
]
标题: 多模态股票价格预测:俄罗斯证券市场的案例研究
标题: Multimodal Stock Price Prediction: A Case Study of the Russian Securities Market
摘要: 经典资产价格预测方法主要依赖于数值数据,如价格时间序列、交易量、限价订单簿数据和技术分析指标。 然而,新闻流在价格形成中起着重要作用,因此开发结合文本和数值数据的多模态方法以提高预测准确性具有高度相关性。 本文研究了利用结合蜡烛图时间序列和文本新闻流数据的多模态方法进行金融资产价格预测的问题。 为该研究收集了一个独特的数据集,其中包括莫斯科交易所交易的176只俄罗斯股票的时间序列以及79,555篇俄语财经新闻文章。 对于文本数据的处理,使用了预训练模型RuBERT和Vikhr-Qwen2.5-0.5b-Instruct(大语言模型),而时间序列和向量化文本数据则使用LSTM循环神经网络进行处理。 实验比较了基于单一模态(仅时间序列)和两种模态的模型,以及各种文本向量表示的聚合方法。 预测质量通过两个关键指标进行评估:准确率(价格变动方向预测:上涨或下跌)和平均绝对百分比误差(MAPE),该指标衡量预测价格与真实价格的偏差。 实验表明,引入文本模态使MAPE值降低了55%。 所得的多模态数据集对于金融领域语言模型的进一步适应具有价值。 未来的研究方向包括优化文本模态参数,如时间窗口、情感和新闻消息的时序顺序。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.