计算机科学 > 分布式、并行与集群计算
[提交于 2025年6月26日
]
标题: 面向计算流体动力学代码的可移植高性能内核生成技术与DaCe
标题: Portable High-Performance Kernel Generation for a Computational Fluid Dynamics Code with DaCe
摘要: 随着新型高性能计算(HPC)加速器的出现,如Nvidia和AMD的GPU,针对不同的硬件架构进行高效编程已成为HPC应用开发者的重大挑战。 HPC系统中日益增加的硬件多样性通常需要开发特定于架构的代码,这阻碍了大规模科学应用的可持续性。 在本工作中,我们利用DaCe,一种以数据为中心的并行编程框架,来自动化生成高性能内核。 DaCe能够为多核处理器和各种加速器自动生成代码,减轻了开发人员需要为每种新架构重写代码的负担。 我们的研究通过将DaCe的自动代码生成应用于计算流体动力学(CFD)中使用的关键计算内核来展示DaCe的能力。 具体来说,我们关注基于Fortran的求解器Neko,它采用谱元方法,该方法依赖于小张量操作。 我们详细说明了使用DaCe的状态化数据流多图(SDFG)表示法来构建此计算内核,并讨论了这种方法如何促进高性能代码的生成。 此外,我们概述了将DaCe生成的代码无缝集成到Neko求解器中的工作流程。 我们的结果突显了生成代码在多个平台上的可移植性和性能,包括Nvidia GH200、Nvidia A100和AMD MI250X GPU,并取得了具有竞争力的性能结果。 通过展示自动代码生成的潜力,我们强调了使用可移植解决方案确保大规模科学应用长期可持续性的可行性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.