统计学 > 机器学习
[提交于 2017年8月30日
(v1)
,最后修订 2019年6月28日 (此版本, v3)]
标题: 图Lasso与阈值化:等价性和闭式解
标题: Graphical Lasso and Thresholding: Equivalence and Closed-form Solutions
摘要: 图拉索(GL)是一种用于学习无向图模型结构的流行方法,它基于一种正则化技术$l_1$。 本文的目的在于比较计算密集型的GL技术与一种基于简单阈值处理样本协方差矩阵的数值廉价启发式方法。 为此,发展了符号一致和逆一致矩阵的两个概念,并且证明如果:(i) 阈值处理后的样本协方差矩阵既是符号一致又是逆一致,以及(ii) 样本协方差矩阵中最大阈值处理条目与最小未处理条目之间的差距不太小,则阈值处理方法与GL方法是等价的。 在此基础上,证明了当阈值处理后的样本协方差矩阵具有无环结构时,GL方法作为一个锥优化问题具有显式的闭式解。 此结果被推广到任意稀疏支持图,找到了一个公式来获得GL的近似解。 此外,还表明随着稀疏图中最小长度循环长度的增加,导出的显式公式的近似误差以指数速度减小。 这些结果在合成数据、功能磁共振成像数据、交通网络的交通流以及大规模随机生成的数据集上进行了演示。 我们展示了所提出的方法可以在标准笔记本电脑上运行MATLAB,在不到30分钟的时间内准确地近似求解大小高达$80,000\times 80,000$(超过32亿个变量)的GL实例,而其他最先进的方法在4小时内无法收敛。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.