计算机科学 > 数据结构与算法
[提交于 2025年10月25日
]
标题: (近似)通过卷积的矩阵乘法
标题: (Approximate) Matrix Multiplication via Convolutions
摘要: 一个长期悬而未决的算法设计问题是,是否“组合”矩阵乘法算法——避免类似Strassen的分治方法——可以实现真正的亚立方时间复杂度$n^{3-\delta}$。我们提出了一种$O(n^{2.89})$时间的精确算法,该算法仅通过FFT在$\mathbb{Z}_m^k$(多变量多项式乘法)中求和卷积,这是基于Cohn、Kleinberg、Szegedy和Umans(CKSU'05)的工作。尽管该算法避免了递归,但渐进速度提升仅适用于不切实际的大矩阵。受实际应用的启发,我们利用这一基准开发了一个新的快速近似矩阵乘法(AMM)框架,通过CKSU多项式的低次数近似。我们证明,将上述算法与黑箱线性投影结合,已经打破了AMM的长期线性速度-精度权衡(Sarlos'06,Clarkson-Woodruff'13,Pagh'11,Cohn-Lewis'00),在$O(rn^2)$时间内达到$\frac{1}{r^{1.1}}\|\mathbf{A}\|_F^2\|\mathbf{B}\|_F^2$的误差。 我们的主要结果是基于一个傅里叶集中引理,对CKSU多项式的一种低次数近似方案,在分布设置中,$\mathbf{A},\mathbf{B}$来自独立同分布乘积分布时,该方案产生了显著更小的误差;对于随机高斯矩阵,这种实用的AMM算法在时间$O(rn^2)$内达到的误差小于输出矩阵$\mathbf{A}\mathbf{B}$的最佳秩$r$的SVD。 这相对于用于低秩逼近的迭代Krylov子空间方法是一个显著改进。 我们的理论和实验结果表明,在LLM训练和推理中有可能用卷积和代替矩阵乘法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.