Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.20994

帮助 | 高级搜索

计算机科学 > 分布式、并行与集群计算

arXiv:2506.20994 (cs)
[提交于 2025年6月26日 ]

标题: 面向计算流体动力学代码的可移植高性能内核生成技术与DaCe

标题: Portable High-Performance Kernel Generation for a Computational Fluid Dynamics Code with DaCe

Authors:Måns I. Andersson, Martin Karp, Niclas Jansson, Stefano Markidis
摘要: 随着新型高性能计算(HPC)加速器的出现,如Nvidia和AMD的GPU,针对不同的硬件架构进行高效编程已成为HPC应用开发者的重大挑战。 HPC系统中日益增加的硬件多样性通常需要开发特定于架构的代码,这阻碍了大规模科学应用的可持续性。 在本工作中,我们利用DaCe,一种以数据为中心的并行编程框架,来自动化生成高性能内核。 DaCe能够为多核处理器和各种加速器自动生成代码,减轻了开发人员需要为每种新架构重写代码的负担。 我们的研究通过将DaCe的自动代码生成应用于计算流体动力学(CFD)中使用的关键计算内核来展示DaCe的能力。 具体来说,我们关注基于Fortran的求解器Neko,它采用谱元方法,该方法依赖于小张量操作。 我们详细说明了使用DaCe的状态化数据流多图(SDFG)表示法来构建此计算内核,并讨论了这种方法如何促进高性能代码的生成。 此外,我们概述了将DaCe生成的代码无缝集成到Neko求解器中的工作流程。 我们的结果突显了生成代码在多个平台上的可移植性和性能,包括Nvidia GH200、Nvidia A100和AMD MI250X GPU,并取得了具有竞争力的性能结果。 通过展示自动代码生成的潜力,我们强调了使用可移植解决方案确保大规模科学应用长期可持续性的可行性。
摘要: With the emergence of new high-performance computing (HPC) accelerators, such as Nvidia and AMD GPUs, efficiently targeting diverse hardware architectures has become a major challenge for HPC application developers. The increasing hardware diversity in HPC systems often necessitates the development of architecture-specific code, hindering the sustainability of large-scale scientific applications. In this work, we leverage DaCe, a data-centric parallel programming framework, to automate the generation of high-performance kernels. DaCe enables automatic code generation for multicore processors and various accelerators, reducing the burden on developers who would otherwise need to rewrite code for each new architecture. Our study demonstrates DaCe's capabilities by applying its automatic code generation to a critical computational kernel used in Computational Fluid Dynamics (CFD). Specifically, we focus on Neko, a Fortran-based solver that employs the spectral-element method, which relies on small tensor operations. We detail the formulation of this computational kernel using DaCe's Stateful Dataflow Multigraph (SDFG) representation and discuss how this approach facilitates high-performance code generation. Additionally, we outline the workflow for seamlessly integrating DaCe's generated code into the Neko solver. Our results highlight the portability and performance of the generated code across multiple platforms, including Nvidia GH200, Nvidia A100, and AMD MI250X GPUs, with competitive performance results. By demonstrating the potential of automatic code generation, we emphasise the feasibility of using portable solutions to ensure the long-term sustainability of large-scale scientific applications.
主题: 分布式、并行与集群计算 (cs.DC) ; 性能 (cs.PF)
引用方式: arXiv:2506.20994 [cs.DC]
  (或者 arXiv:2506.20994v1 [cs.DC] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.20994
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Måns I. Andersson [查看电子邮件]
[v1] 星期四, 2025 年 6 月 26 日 04:17:38 UTC (297 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.DC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
cs.PF

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号