计算机科学 > 图形学
[提交于 2025年9月4日
]
标题: 基于块间GPU同步的不可伸长弹性杆的大规模并行实现
标题: Massively-Parallel Implementation of Inextensible Elastic Rods Using Inter-block GPU Synchronization
摘要: 一种弹性杆是一种能够承受大范围整体变形的长而细的物体,即使局部应变很小。 Cosserat杆是一种具有定向中心线的非线性弹性杆,这使得可以对弯曲、拉伸和扭转变形进行建模。 它可以用于基于物理的计算机模拟线、电线、绳索,以及柔性手术器械,如导管、导丝或缝线。 我们展示了原始CoRdE模型以及我们不可伸长变体的大规模并行实现。 通过取代CUDA可扩展编程模型并使用块间同步,我们成功地在单个内核启动中模拟多个物理时间步,利用所有GPU的流式多处理器。 在某些约束条件下,这导致计算时间几乎保持恒定,无论模拟的Cosserat元素数量如何。 当每个内核启动执行10个时间步时,我们对原始可伸长CoRdE的实现快了x40.0倍。 在一些测试中,我们不可伸长的CoRdE修改的GPU实现相对于相应的CPU版本平均快了x15.11倍。 在心血管应用中模拟导管/导丝对(2x512个Cosserat元素)实现了13.5倍的性能提升,能够在触觉交互速率(0.5-1kHz)下实现准确的实时模拟。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.