统计学 > 方法论
[提交于 2025年10月16日
]
标题: 分组间聚类的分层泊松噪声柯克斯过程混合模型
标题: Hierarchical shot-noise Cox process mixtures for clustering across groups
摘要: 在部分可交换的数据组中对观测进行聚类是贝叶斯非参数学中的常规任务。 先前提出的模型通过在组特定的混合度量中共享原子来实现跨组的聚类。 然而,当组之间存在细微差异时,精确的原子共享可能会过于僵硬,这在较大样本量下会引入聚类和密度估计之间的权衡,并导致跨组聚类的碎片化。 我们引入了分层噪声点 Cox 过程(HSNCP)混合模型,其中组特定的原子通过核函数集中在共享中心周围。 这使得组内的密度估计更加准确,并实现了跨组的灵活借用,克服了之前方法的密度-聚类权衡。 我们的构造基于噪声点 Cox 过程,保持了分析上的可处理性:我们推导出闭合形式的先验矩和组间相关性,得到了潜在参数的边缘分布和预测分布,以及给定潜在参数的混合度量的后验分布。 我们开发了一个高效的条件 MCMC 算法用于后验推断。 我们通过模拟和对一个大型星系数据集的应用评估了 HSNCP 模型的性能,证明了与分层 Dirichlet 过程相比,HSNCP 模型能够实现平衡的跨组聚类和改进的密度估计,包括在模型误指的情况下。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.