统计学 > 机器学习
[提交于 2025年7月14日
]
标题: 通过单纯形路径的鲁棒多流形聚类
标题: Robust Multi-Manifold Clustering via Simplex Paths
摘要: 本文介绍了一种新颖的几何方法用于多流形聚类(MMC),即对一组可能相交的d维流形进行聚类,以分离出各个流形组件。我们首先在d-单形上计算一个局部图,使用相邻单形之间的二面角作为图权重,然后在此单形图中计算无限路径距离。此过程给出了一个单形上的度量,我们称之为最大角路径距离(LAPD)。我们分析了在随机采样下LAPD的性质,并证明通过适当的去噪过程,该度量可以以高概率分离流形组件。我们在合成和真实世界数据集上进行了大量数值实验,验证了所提出的方法。这些实验表明,该方法对噪声、曲率和小的相交角度具有鲁棒性,并且通常优于其他MMC算法。此外,我们提供了一个高度可扩展的所提出算法的实现,该实现利用了无限路径距离的近似方案,以实现准线性计算复杂度。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.