计算机科学 > 数据结构与算法
[提交于 2025年6月30日
]
标题: 使用矩阵乘法的分段操作
标题: Segmented Operations using Matrix Multiplications
摘要: 专门执行小矩阵乘法作为基本操作的计算单元通常存在于现代加速器中。 然而,这些单元在许多基本操作中除了密集矩阵乘法之外常常被低估使用。 由于缺乏一个能捕捉其特性的严格理论计算模型,目前对这类架构的算法分析处于停滞状态。 在本工作中,我们提出了 MMV-RAM,一种针对矩阵乘法加速器的计算模型。 MMV-RAM谨慎地扩展了 Vector-RAM 模型,增加了一个额外的处理单元,该单元可以在单个并行步骤中对大小为 $n\times s$ 和 $s\times s$ 的两个矩阵进行相乘,其中 $s$ 是一个模型参数。 我们提供了该模型的详细理论分析,并在矩阵和向量单元之间仔细平衡计算能力,这是由奇偶性不在 AC[0] 中的电路复杂度下限所指导的。 在 MMV-RAM 中,我们研究了分段扫描和求和的算法,这两个是基本的并行原语。 我们提出了一种分段扫描算法,该算法使用矩阵乘法来执行推测性块扫描计算,运行时间为 $O(\log_s(n))$ 步。 相比之下,我们证明任何仅使用 MMV-RAM 向量单元的算法都需要 $\Omega\left(\frac{\log_2(n)}{\log_2\log_2(n)}\right)$ 步。 我们进一步应用这些技术,以获得元素级向量乘法和矩阵乘法的类似理论加速效果。 除了最坏情况下的复杂度分析外,我们提出了可用于高效且实际实现的分段操作算法。 例如,我们观察到分段求和是三个基本并行原语的组合:扫描、压缩和向量微分。 作为案例研究,我们实现了...
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.