物理学 > 计算物理
[提交于 2025年1月9日
(v1)
,最后修订 2025年5月29日 (此版本, v2)]
标题: 使GPU可移植性进入Numba-JITed蒙特卡罗粒子输运代码MC/DC
标题: Enabling GPU Portability into the Numba-JITed Monte Carlo Particle Transport Code MC/DC
摘要: 极大规模蒙特卡洛中子输运研究中心正在开发蒙特卡洛/动态代码(MC/DC),作为一个可在基于CPU和GPU的高性能计算机上快速探索数值方法的可移植蒙特卡洛中子输运包。在本文中,我们描述了MC/DC当前基于事件的GPU算法,以及我们在MC/DC的Python源代码中使用的即时(JIT)编译方案,以实现MC/DC在Nvidia和AMD GPU上的可操作性。为了分析性能,我们对C5G7 keigenvalue基准问题和一个连续能量无限针单元,在Nvidia Tesla V100 GPU、AMD MI250X GPU和AMD MI300A APU上进行了运行时测试,并与双插槽Intel Xeon Sapphire Rapids CPU节点进行了比较。我们发现,对于多群组C5G7基准问题,在V100、MI250X和MI300A上分别比112个Intel Xeon CPU核心获得了15$\times$、0.7$\times$、12$\times$的加速。对于连续能量无限针单元基准,我们发现在V100、MI250X和MI300A上分别比同一CPU节点获得了5$\times$、3$\times$、4$\times$的加速。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.