计算机科学 > 机器学习
[提交于 2025年7月22日
]
标题: 一种分块稀疏变分高斯过程用于快速分布式空间建模
标题: A Partitioned Sparse Variational Gaussian Process for Fast, Distributed Spatial Modeling
摘要: 下一代能源部超级计算机将能够进行艾克萨级计算。 对于这些机器,可以进行的计算远多于可以保存到磁盘的数据。 因此,用户将无法依赖事后访问数据来进行不确定性量化和其他统计分析,迫切需要能够在现场训练的复杂机器学习算法。 在这种情况下部署的算法必须高度可扩展、内存高效,并且能够处理分布在各个节点上的空间连续分区的数据。 一种合适的方法是独立且并行地对每个空间分区拟合一个稀疏变分高斯过程(SVGP)模型。 该模型具有可扩展性、高效性和普遍准确性,但由于相邻模型在其共享边界处的不一致,会产生构造不连续响应面的不良效果。 在本文中,我们通过允许相邻空间分区之间进行少量通信来扩展这一想法,这有助于局部模型的更好对齐,从而实现更平滑的空间预测,并总体上获得更好的拟合效果。 由于我们的去中心化通信方案,所提出的扩展仍然高度可扩展,并在计算方面增加很少的开销(在内存方面则完全没有)。 我们展示了用于能源埃克萨级地球系统模型(E3SM)的分区SVGP(PSVGP)方法,并将结果与独立SVGP的情况进行了比较。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.