计算机科学 > 分布式、并行与集群计算
[提交于 2025年7月15日
]
标题: 使用混合精度跨越内存墙 -- 在百亿亿次机器上的HPG-MxP
标题: Scaling the memory wall using mixed-precision -- HPG-MxP on an exascale machine
摘要: 混合精度算法被提出作为一种方式,使科学计算能够从最近高性能计算(HPC)平台上看到的人工智能(AI)的一些优势中受益。 一些以密集矩阵运算为主的应用程序通过利用低精度格式如FP16已经看到了显著的加速。 然而,大多数科学模拟应用程序受内存带宽限制。 除了初步研究外,在给定的HPC系统上使用混合精度算法的实际收益仍然 largely 不清楚。 高性能GMRES混合精度(HPG-MxP)基准已被提出,以衡量HPC系统在基于稀疏矩阵的混合精度应用程序中的有用性能。 在这项工作中,我们为exascale系统提出了HPG-MxP基准的高效优化实现,并描述了我们的算法增强。 我们首次展示了在现代基于GPU的超级计算机上结合双精度和单精度使用的1.6倍加速。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.