统计学 > 机器学习
[提交于 2017年6月13日
]
标题: 通过Wasserstein均值的多层聚类
标题: Multilevel Clustering via Wasserstein Means
摘要: 我们提出了一种针对多级聚类问题的新方法,该方法旨在同时对每个组内的数据进行划分,并在潜在的大规模具有层次结构的数据集中发现组与组之间的分组模式。 我们的方法涉及在多个离散概率测度空间上的联合优化公式,这些空间配备了 Wasserstein 距离度量。 通过利用与计算 Wasserstein 平均问题的联系,我们提出了该问题的若干变体,这些变体可以采用快速优化算法。 建立了局部和全局聚类估计的一致性性质。 最后,展示了合成数据和真实数据的实验结果,以证明所提出方法的灵活性和可扩展性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.