Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.05938

帮助 | 高级搜索

计算机科学 > 分布式、并行与集群计算

arXiv:2501.05938 (cs)
[提交于 2025年1月10日 ]

标题: 基于机器学习的三对角分块方法在GPU实现中的最优CUDA流数量

标题: ML-Based Optimum Number of CUDA Streams for the GPU Implementation of the Tridiagonal Partition Method

Authors:Milena Veneva, Toshiyuki Imamura
摘要: 本文提出了一种启发式方法,通过使用现代面向人工智能的方法常用的工具,来找到最优的CUDA流数量,并应用于并行划分算法。 构建了GPU实现划分方法的时间复杂度模型。 进一步提出了在多个CUDA流上执行的划分算法的细化时间复杂度模型。 进行了不同SLAE大小的计算实验,并通过实验方法找到了每个情况下的最优CUDA流数量。 基于收集的数据,使用回归分析建立了非主导GPU操作时间总和的模型(这些操作参与流重叠)。 创建了一个与CUDA流创建相关的开销时间的拟合非线性模型。 对所有构建的模型进行了统计分析。 制定了寻找最优CUDA流数量的算法。 使用该算法以及上述两个模型,做出了最优CUDA流数量的预测。 将预测值与实际数据进行比较,该算法被认为是可以接受的。
摘要: This paper presents a heuristic for finding the optimum number of CUDA streams by using tools common to the modern AI-oriented approaches and applied to the parallel partition algorithm. A time complexity model for the GPU realization of the partition method is built. Further, a refined time complexity model for the partition algorithm being executed on multiple CUDA streams is formulated. Computational experiments for different SLAE sizes are conducted, and the optimum number of CUDA streams for each of them is found empirically. Based on the collected data a model for the sum of the times for the non-dominant GPU operations (that take part in the stream overlap) is formulated using regression analysis. A fitting non-linear model for the overhead time connected with the creation of CUDA streams is created. Statistical analysis is done for all the built models. An algorithm for finding the optimum number of CUDA streams is formulated. Using this algorithm, together with the two models mentioned above, predictions for the optimum number of CUDA streams are made. Comparing the predicted values with the actual data, the algorithm is deemed to be acceptably good.
评论: 7页,4图,5表,MMCP会议2024,埃里温,亚美尼亚
主题: 分布式、并行与集群计算 (cs.DC)
MSC 类: 65Y05, 65Y10, 90C59, 68T20
引用方式: arXiv:2501.05938 [cs.DC]
  (或者 arXiv:2501.05938v1 [cs.DC] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.05938
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Milena Veneva [查看电子邮件]
[v1] 星期五, 2025 年 1 月 10 日 13:02:22 UTC (163 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs.DC

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号