计算机科学 > 数据结构与算法
[提交于 2019年9月29日
]
标题: Kronecker乘积回归和低秩逼近的最优草图
标题: Optimal Sketching for Kronecker Product Regression and Low Rank Approximation
摘要: 我们研究Kronecker乘积回归问题,其中设计矩阵是两个或更多矩阵的Kronecker乘积。 给定$A_i \in \mathbb{R}^{n_i \times d_i}$对于$i=1,2,\dots,q$其中$n_i \gg d_i$对于每个$i$,以及$b \in \mathbb{R}^{n_1 n_2 \cdots n_q}$,令$\mathcal{A} = A_1 \otimes A_2 \otimes \cdots \otimes A_q$。 然后对于$p \in [1,2]$,目标是找到近似最小化$\|\mathcal{A}x - b\|_p$的$x \in \mathbb{R}^{d_1 \cdots d_q}$。 最近,Diao、Song、Sun 和 Woodruff(AISTATS,2018)给出了一种比构造 Kronecker 积更快的算法$\mathcal{A}$ 具体来说,对于$p=2$,其运行时间为$O(\sum_{i=1}^q \text{nnz}(A_i) + \text{nnz}(b))$,其中 nnz$(A_i)$是$A_i$中非零条目的数量。 注意,nnz$(b)$可以高达$n_1 \cdots n_q$。 对于$p=1,$ $q=2$ 和$n_1 = n_2$,它们获得了一个更差的界$O(n_1^{3/2} \text{poly}(d_1d_2) + \text{nnz}(b))$。 在本工作中,我们提供了显著更快的算法。 对于$p=2$,我们的运行时间是$O(\sum_{i=1}^q \text{nnz}(A_i) )$,其不依赖于 nnz$(b)$。 对于$p<2$,我们的运行时间是$O(\sum_{i=1}^q \text{nnz}(A_i) + \text{nnz}(b))$,这与之前对于$p=2$的最佳运行时间相匹配。 我们还考虑了相关的所有对回归问题,其中给定$A \in \mathbb{R}^{n \times d}, b \in \mathbb{R}^n$,我们想要求解$\min_{x} \|\bar{A}x - \bar{b}\|_p$,其中$\bar{A} \in \mathbb{R}^{n^2 \times d}, \bar{b} \in \mathbb{R}^{n^2}$包含$A,b$行的所有成对差值。 我们给出一个$O(\text{nnz}(A))$时间算法用于$p \in[1,2]$,改进了形成$\bar{A}$所需的$\Omega(n^2)$时间。 最后,我们开始研究Kronecker积低秩和低$t$-秩逼近。 对于输入$\mathcal{A}$如上,我们给出$O(\sum_{i=1}^q \text{nnz}(A_i))$时间算法,这比计算$\mathcal{A}$快得多。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.