计算机科学 > 计算与语言
[提交于 2025年1月3日
]
标题: 时间序列语言模型用于描述性标题生成
标题: Time Series Language Model for Descriptive Caption Generation
摘要: 时间序列数据中可观察模式的代表性自然语言描述的自动生成增强了可解释性,简化了分析,并提高了时间数据的跨领域实用性。 尽管预训练基础模型在自然语言处理(NLP)和计算机视觉(CV)方面取得了显著进展,但数据稀缺性阻碍了它们在时间序列分析中的应用。 虽然已经提出了几种基于大型语言模型(LLM)的时间序列预测方法,但在LLM背景下,时间序列字幕生成仍研究不足。 在本文中,我们介绍了TSLM,这是一种专为时间序列字幕设计的新颖时间序列语言模型。 TSLM作为一个编码器-解码器模型运行,利用文本提示和时间序列数据表示来捕捉多个阶段的细微时间模式,并生成对时间序列输入的精确文本描述。 TSLM通过首先利用上下文提示合成数据生成,其次通过一种新颖的跨模态密集检索评分对时间序列-字幕对进行去噪,解决了时间序列字幕生成中的数据稀缺问题。 在各种时间序列字幕数据集上的实验结果表明,TSLM在多个数据模态下显著优于现有的最先进方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.