天体物理学 > 天体物理学的仪器与方法
[提交于 2012年9月17日
]
标题: 使用机器学习在巡天调查成像中进行发现
标题: Using Machine Learning for Discovery in Synoptic Survey Imaging
摘要: 现代时域巡天持续监测大量天空区域以寻找天文变化。 在这种数据集中,天体发现的复杂性在于真实的瞬变和可变源的检测被由不完美的减法、大气效应和探测器 artifacts 引起的虚假检测大大超过。 在这项工作中,我们提出了一个用于时域成像巡天中可变性发现的机器学习(ML)框架。 我们的ML方法提供了概率陈述,在接近实时的情况下,关于每个新观测到的源成为具有可变亮度的天体物理相关源的程度。 我们提供了每个分析步骤的详细信息,包括训练集和测试集的编译、描述性基于图像和上下文特征的构建,以及特征子集和模型调整参数的优化。 使用来自帕洛玛瞬变工厂的近30,000个对象的验证集,我们展示了在选择的误报率为1%的情况下,对于经过优化的23个特征的ML分类器,漏检率最多为7.7%,这些特征从最初的42个属性库中选出,以避免特征相关性和过拟合。 重要的是,我们表明,我们的分类方法对训练数据中多达10%的错误标记不敏感,这使得在未来调查中更容易编译足够的训练集以获得准确的性能。 如果采用此ML框架,应能最大化未来综合调查的科学收益,并能够对这类实验产生的大量流数据做出快速跟进决策。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.