天体物理学 > 天体物理学的仪器与方法
[提交于 2024年4月16日
(v1)
,最后修订 2025年2月24日 (此版本, v2)]
标题: 基于深度学习和LLM的方法应用于恒星光变曲线分类
标题: Deep Learning and LLM-based Methods Applied to Stellar Lightcurve Classification
摘要: 光曲线是研究恒星形成和演化的宝贵信息来源。随着机器学习技术的快速发展,它可以被有效处理以提取天文模式和信息。在这项研究中,我们基于开普勒和K2任务的大数据集,提出了深度学习和大型语言模型(LLM)基模型在变星光曲线自动分类中的综合评估。特别强调造父变星、RR lyrae和掩食双星,探讨观测周期和相位分布对分类精度的影响。通过AutoDL优化,我们实现了令人瞩目的性能,使用1D卷积+双向LSTM架构和Swin Transformer,分别达到94%和99%的准确率,后者在分辨仅占总数据集0.02%的难以捉摸的II型造父变星时表现出显著的83%准确率。我们揭示了StarWhisper LightCurve(LC),这是一个由三个基于LLM的模型组成的创新系列:LLM、多模态大型语言模型(MLLM)和大型音频语言模型(LALM)。每个模型都经过战略性提示工程和定制化训练方法微调,以探索这些模型在天文学数据中的新兴能力。值得注意的是,StarWhisper LC系列表现出约90%的高准确率,大大减少了显式特征工程的需求,从而为天文学应用中流线型并行数据处理和多模态模型的发展铺平了道路。该研究提供了两个详细的目录,展示了相位和采样间隔对深度学习分类准确性的影响,表明观察时间缩短高达14%,采样点减少21%,而不降低超过10%的准确性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.