计算机科学 > 分布式、并行与集群计算
[提交于 2025年4月16日
]
标题: 高维高斯过程模拟的缩放块Vecchia近似方法在GPU上的应用
标题: Scaled Block Vecchia Approximation for High-Dimensional Gaussian Process Emulation on GPUs
摘要: 模拟计算密集型科学仿真对于在大规模下实现不确定性量化、优化和决策制定至关重要。 高斯过程(GPs)为统计模拟提供了一种灵活且数据高效的框架,但其较差的可扩展性限制了其在大数据集上的应用。 我们引入了缩放块Vecchia(SBV)算法,用于分布式GPU系统。 SBV结合了适用于各向异性输入缩放的缩放Vecchia方法和块Vecchia(BV)方法,在降低计算和内存复杂度的同时,利用GPU加速技术进行高效的线性代数运算。 据我们所知,这是任何基于Vecchia的GP变体的第一个分布式实现。 我们的实现使用MPI实现节点间并行,并使用MAGMA库进行GPU加速的批量矩阵计算。 我们通过在合成和现实世界工作负载上的实验展示了所提出算法的可扩展性和效率,包括来自呼吸系统疾病模型的50M点模拟。 SBV在最多64个A100和GH200 GPU上实现了近线性可扩展性,处理3.2亿个点,并相对于精确GP求解器减少了能耗,确立了SBV作为在基于GPU的分布式系统上模拟大规模科学模型的可扩展且节能的框架。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.