统计学 > 计算
[提交于 2025年6月19日
]
标题: 理解贝叶斯聚类分析中的不确定性
标题: Understanding uncertainty in Bayesian cluster analysis
摘要: 基于贝叶斯方法的聚类通常因其能够提供分区结构中的不确定性而受到赞赏。然而,由于聚类空间具有离散、无序且维度巨大的特性,总结聚类结构的后验分布可能具有挑战性。尽管最近的进展提供了单一的聚类估计来表示后验分布,但在后验分布呈现多模态的情况下,这种做法会忽略不确定性,甚至可能是不具代表性的。为了增强我们对不确定性的理解,我们提出了一个用于贝叶斯聚类的WASserstein近似(WASABI),它通过多个而非单一的聚类估计来总结后验样本,每个估计对应于接收大量后验质量的分区空间的不同部分。具体来说,我们通过在分区空间上配备适当的度量,在Wasserstein距离的意义下逼近后验分布,从而找到这些聚类估计。一个有趣的副产品是,可以通过在分区空间上使用类似于k-medoids的算法将后验样本划分为不同的组,每组由其中一个聚类估计表示。利用合成数据集和真实数据集,我们展示了我们的方法有助于提高对不确定性的理解,特别是在数据聚类不完全分离或所采用模型设定错误的情况下。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.