物理学 > 地球物理
[提交于 2025年5月24日
]
标题: 一个全球规模的地震相云拾取数据集(PB级)
标题: A Global-scale Database of Seismic Phases from Cloud-based Picking at Petabyte Scale
摘要: 我们展示了首个全球规模的数据库,其中包含从 1.3 PB 连续地震数据中提取的 43 亿个 P 波和 S 波拾取结果,这些结果是通过云原生工作流生成的。 利用亚马逊云服务(Amazon Web Services)的云计算服务,我们在跨越 2002 年至 2025 年的 47,354 个台站的连续记录上启动了约 145,000 个容器化任务,所有任务在不到三天的时间内完成。 震相到达时间通过深度学习模型 PhaseNet 确定,PhaseNet 是一个用于深度学习的开源 Python 生态系统 SeisBench 的一部分。 为了可视化并全面了解这些拾取结果,我们展示了初步结果,揭示了 Omori 律余震衰减、与噪声水平相关的季节性变化以及密集区域覆盖情况,这将提升地震目录和机器学习数据集的质量。 我们将所有拾取结果存储在一个可公开查询的数据库中,为研究全球地震活动的研究人员提供了一个强大的资源。 本报告提供了对数据库及其底层工作流的见解,证明了在云上进行千兆字节规模的地震数据分析的可行性,并展示了以自动化方式向社区提供智能数据产品的可能性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.