物理学 > 计算物理
[提交于 2025年4月6日
(v1)
,最后修订 2025年4月8日 (此版本, v2)]
标题: 基于GPU的非均匀网格可压缩格子玻尔兹曼模拟,使用标准C++并行性:从最佳实践到空气动力学、气动声学和超音速流模拟
标题: GPU-based compressible lattice Boltzmann simulations on non-uniform grids using standard C++ parallelism: From best practices to aerodynamics, aeroacoustics and supersonic flow simulations
摘要: 尽管经过数十年的研究,在非均匀网格上创建准确、鲁棒且高效的格子玻尔兹曼方法(LBM)并实现无缝GPU加速仍然是一个挑战。本工作引入了一种新策略来解决这一挑战,通过整合简单但有效的组件:(1) 现代C++中的并行算法,(2) 保守的单元中心网格细化,(3) 局部边界条件,以及(4) 鲁棒的碰撞模型。我们的框架支持多种晶格(D2Q9、D2Q13、D2Q21、D2Q37),针对不同的流动条件进行了优化。它包括具有多项式和数值平衡的碰撞模型,一种用于多原子行为的第二分布函数,一种类似Jameson的激波传感器,并推广了Rohde的细化策略。该框架的准确性与鲁棒性在多种基准测试中得到了验证,包括驱动腔流、风成噪声、30P30N机翼空气动力学、无粘性黎曼问题以及跨音速和超音速状态下NACA机翼的粘性流动。现代C++进一步使我们的框架达到GPU原生性能,同时确保高可移植性、模块化和易于实现。值得注意的是,弱可压缩LBMs在非均匀网格上实现了最先进的GPU效率,而完全可压缩LBMs在最计算密集的情况下受益于相当于数千个CPU核心的加速效果。我们的先进性能模型包含了邻居列表和异步时间步进效应,为非均匀网格上LB模拟的性能分解提供了新的见解。总体而言,这项研究为可移植的、基于树的LBMs设定了新标准,证明了精心选择的组件组合可以在各种流动条件下实现高性能、高精度和鲁棒性。作为最终的概念验证,提出了适用于亚音速和超音速应用的自适应网格细化。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.