天体物理学 > 宇宙学与非星系天体物理学
[提交于 2009年9月29日
]
标题: 为虚拟天文台时代准备老旧和近期的射电源表:现状
标题: Preparing old and recent radio source tables for the VO age: Current status
摘要: 独立于现有的数据中心,并且部分是为了我的研究,我已经收集了近1500篇关于射电源的论文中的表格数据。 光学字符识别(OCR)被用来从这将近600篇论文中恢复表格。 这些论文中只有44%的表格可以在CDS或CATS目录集合中找到。 对于超过100个源的文章,这一比例为62%。 令人惊讶的是,自2001年以来发表的电子文章的这些比例并没有更好,可能部分原因是由于表格数据常常以不适合直接机器阅读的格式发布。 Simbad和NED数据库只识别大约60%的与现有电子射电源列表相对应的参考文献,而与这些参考文献相关联的对象数量还要少得多。 无论是像NED和Simbad这样的对象数据库,还是目录浏览器(VizieR、CATS),都需要查阅以获取有关射电源的最完整信息。 需要增加数据中心的人力资源,并加强作者、审稿人、编辑、出版商和数据中心之间的合作,以改善期刊到公共数据库的表格数据流动。 虚拟天文台(VO)项目中的当前努力,为存储在不同站点的各种已发布的和存档的数据提供检索和分析工具,应该通过同等的努力来恢复和包括大量目前无法以这种方式获得的已发表数据来平衡。 如果能找到人力,作者收集的数据集将用于准备元数据,以便它们可以进入目录浏览器。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.