数学 > 统计理论
[提交于 2008年4月4日
]
标题: 谱聚类的一致性
标题: Consistency of spectral clustering
摘要: 一致性是分析随机抽样数据的所有统计程序的关键属性。 令人惊讶的是,尽管几十年来人们一直在研究,但大多数聚类算法的一致性却知之甚少。 本文我们研究了流行的谱聚类算法族的一致性,该算法通过图拉普拉斯矩阵的特征向量来聚类数据。 我们开发了新的方法来证明,对于样本容量增大时,那些特征向量会收敛到某些极限算子的特征向量。 结果表明,我们可以证明谱聚类两大主要类别之一(归一化聚类)在非常一般的条件下收敛,而另一个(未归一化聚类)仅在强附加假设下才一致,而这些假设在实际数据中并不总是成立。 我们得出结论,我们的分析提供了有力的证据,证明归一化谱聚类的优越性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.