数学 > 数值分析
[提交于 2024年12月16日
(v1)
,最后修订 2025年7月3日 (此版本, v2)]
标题: Cholesky分解中具有动态稀疏模式的自适应代数重用重新排序
标题: Adaptive Algebraic Reuse of Reordering in Cholesky Factorization with Dynamic Sparsity Pattern
摘要: Cholesky线性求解器在计算机图形学和科学计算中的挑战性应用中是一个关键的瓶颈。 这些应用包括但不限于弹性动力学屏障方法,如增量势接触(IPC),以及几何操作,如重网格化和形态学。 在这些情况下,线性系统的稀疏模式在连续调用Cholesky求解器时经常发生变化,需要重复的符号分析,这主导了整体求解器运行时间。 为了解决这个瓶颈,我们在来自增量势接触(IPC)和各种大小的三角形网格上的补丁重网格化中具有动态稀疏变化的多样化非线性问题生成的超过150,000个线性系统上评估了我们的方法。 我们使用三个领先的稀疏Cholesky库,Intel MKL Pardiso、SuiteSparse CHOLMOD和Apple Accelerate进行分析,结果表明主要性能限制在于求解器的符号重新排序阶段。 认识到这一点,我们引入了Parth,一种创新的重新排序方法,旨在自适应地仅在局部连通性发生变化的地方更新排序向量。 Parth采用了一种新颖的分层图分解算法,将输入矩阵的对偶图分解成细粒度的子图,当稀疏模式表现出时间一致性时,促进填充减少排序的选择性重用。 我们的广泛评估表明,Parth在我们的IPC和重网格化基准测试中实现了填充减少排序高达255倍和13倍的速度提升,在符号分析中实现了6.85倍和10.7倍的加速。 这些改进转化为整体求解器运行时间高达2.95倍和5.89倍的减少。 此外,Parth的集成只需三行代码,从而在不需要更改计算堆栈的情况下实现显著的计算节省。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.