高能物理 - 格点
[提交于 2011年5月11日
]
标题: 使用GPU加速QDP++
标题: Accelerating QDP++ using GPUs
摘要: 图形处理单元(GPUs)在科学高性能计算(HPC)中的目标架构方面变得越来越重要。 NVIDIA 将 CUDA 设定为一种并行计算架构,用于控制和利用 GPU 的计算能力。 CUDA 为 C++ 语言元素提供了足够的支持,以在设备内存域中实现表达式模板(ET)技术。 QDP++ 是一个适用于量子场论的 C++ 向量类库,提供向量数据类型和表达式,并构成了格点 QCD 软件套件 Chroma 的基础。 在这项工作中,成功实现了利用 ET 技术并使用即时(JIT)编译来加速 QDP++ 表达式评估到 GPU。 便携式表达式模板引擎(PETE)和 CUDA 内核参数的 C API 被用来在主机和设备内存域之间建立桥梁。 这提供了将通常不进行特殊优化的 Chroma 过程加速到 GPU 的可能性。 作为应用示例,一种平滑过程被加速以在 GPU 上执行。 与正常的 CPU 执行相比,可以测量到显著的速度提升。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.