Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.22818

帮助 | 高级搜索

计算机科学 > 分布式、并行与集群计算

arXiv:2506.22818 (cs)
[提交于 2025年6月28日 ]

标题: TriADA:用于加速三维离散变换的大规模并行三线性矩阵-张量乘加算法和设备架构

标题: TriADA: Massively Parallel Trilinear Matrix-by-Tensor Multiply-Add Algorithm and Device Architecture for the Acceleration of 3D Discrete Transformations

Authors:Stanislav Sedukhin (1), Yoichi Tomioka (1), Kazuya Matsumoto (1), Yuichi Okuyama (1) ((1) The University of Aizu, Japan)
摘要: 多线性变换在高性能计算(HPC)和人工智能(AI)工作负载中至关重要,其中数据以张量形式表示。 然而,它们的高计算和内存需求随着维度的增加而增加,常常减缓关键任务。 此外,通过增加并行处理单元的数量来扩展计算会显著增加能耗,限制了广泛采用,尤其是在稀疏数据的情况下,这在HPC和AI应用中很常见。 本文介绍了三线性算法和同构算法设备架构(TriADA),以解决这些挑战,并具有以下创新:(1)一种大规模并行、低秩算法,用于计算一组三线性(3D)离散正交变换(3D-DXTs),这是更一般的三模式矩阵乘张量(3D-GEMT)的特殊情况;(2)一种基于外积的新GEMM内核,具有解耦流式活动内存,专门设计用于加速3D-GEMT操作;(3)一种与所提出算法同构的,完全分布的三维网格互连处理单元或单元网络,具有无坐标、数据驱动的局部处理活动,与问题规模无关;(4)一种弹性稀疏外积(ESOP)方法,避免了具有零值操作数的不必要的计算和通信操作,从而提高了能效、计算精度和稳定性。 TriADA能够在时间步数线性的情况下执行各种三线性变换,具有超立方体算术复杂度。 TriADA的大规模并行、可扩展和节能架构非常适合加速多线性张量操作,这是AI和HPC工作负载中最耗资源的部分。
摘要: Multilinear transformations are key in high-performance computing (HPC) and artificial intelligence (AI) workloads, where data is represented as tensors. However, their high computational and memory demands, which grow with dimensionality, often slow down critical tasks. Moreover, scaling computation by enlarging the number of parallel processing units substantially increases energy consumption, limiting widespread adoption, especially for sparse data, which is common in HPC and AI applications. This paper introduces the Trilinear Algorithm and isomorphic to algorithm Device Architecture (TriADA) to address these challenges with the following innovations: (1) a massively parallel, low-rank algorithm for computing a family of trilinear (3D) discrete orthogonal transformations (3D-DXTs), which is a special case of the more general 3-mode matrix-by-tensor multiplication (3D-GEMT); (2) a new outer-product-based GEMM kernel with decoupled streaming active memory, specially designed to accelerate 3D-GEMT operation; (3) an isomorphic to the proposed algorithm, fully distributed 3D network of mesh interconnected processing elements or cells with a coordinate-free, data-driven local processing activity, which is independent of problem size; (4) an elastic sparse outer-product (ESOP) method that avoids unnecessary computing and communication operations with zero-valued operands, thereby enhancing energy efficiency, computational accuracy, and stability. TriADA is capable of performing a variety of trilinear transformations with hypercubic arithmetic complexity in a linear number of time-steps. The massively parallel, scalable, and energy-efficient architecture of TriADA is ideal for accelerating multilinear tensor operations, which are the most demanding parts of AI and HPC workloads.
评论: 19页,5图
主题: 分布式、并行与集群计算 (cs.DC) ; 人工智能 (cs.AI); 硬件架构 (cs.AR); 新兴技术 (cs.ET); 信号处理 (eess.SP)
ACM 类: C.1.4; C.3; F.2.1; G.1.3; G.4
引用方式: arXiv:2506.22818 [cs.DC]
  (或者 arXiv:2506.22818v1 [cs.DC] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.22818
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Stanislav Sedukhin [查看电子邮件]
[v1] 星期六, 2025 年 6 月 28 日 08:42:01 UTC (628 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.AR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
cs.AI
cs.DC
cs.ET
eess
eess.SP

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号