Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2510.14681

帮助 | 高级搜索

统计学 > 方法论

arXiv:2510.14681 (stat)
[提交于 2025年10月16日 ]

标题: 分组间聚类的分层泊松噪声柯克斯过程混合模型

标题: Hierarchical shot-noise Cox process mixtures for clustering across groups

Authors:Alessandro Carminati, Mario Beraha, Federico Camerlenghi, Alessandra Guglielmi
摘要: 在部分可交换的数据组中对观测进行聚类是贝叶斯非参数学中的常规任务。 先前提出的模型通过在组特定的混合度量中共享原子来实现跨组的聚类。 然而,当组之间存在细微差异时,精确的原子共享可能会过于僵硬,这在较大样本量下会引入聚类和密度估计之间的权衡,并导致跨组聚类的碎片化。 我们引入了分层噪声点 Cox 过程(HSNCP)混合模型,其中组特定的原子通过核函数集中在共享中心周围。 这使得组内的密度估计更加准确,并实现了跨组的灵活借用,克服了之前方法的密度-聚类权衡。 我们的构造基于噪声点 Cox 过程,保持了分析上的可处理性:我们推导出闭合形式的先验矩和组间相关性,得到了潜在参数的边缘分布和预测分布,以及给定潜在参数的混合度量的后验分布。 我们开发了一个高效的条件 MCMC 算法用于后验推断。 我们通过模拟和对一个大型星系数据集的应用评估了 HSNCP 模型的性能,证明了与分层 Dirichlet 过程相比,HSNCP 模型能够实现平衡的跨组聚类和改进的密度估计,包括在模型误指的情况下。
摘要: Clustering observations across partially exchangeable groups of data is a routine task in Bayesian nonparametrics. Previously proposed models allow for clustering across groups by sharing atoms in the group-specific mixing measures. However, exact atom sharing can be overly rigid when groups differ subtly, introducing a trade-off between clustering and density estimates and fragmenting across-group clusters, particularly at larger sample sizes. We introduce the hierarchical shot-noise Cox process (HSNCP) mixture model, where group-specific atoms concentrate around shared centers through a kernel. This enables accurate density estimation within groups and flexible borrowing across groups, overcoming the density-clustering trade-off of previous approaches. Our construction, built on the shot-noise Cox process, remains analytically tractable: we derive closed-form prior moments and an inter-group correlation, obtain the marginal law and predictive distribution for latent parameters, as well as the posterior of the mixing measures given the latent parameters. We develop an efficient conditional MCMC algorithm for posterior inference. We assess the performance of the HSNCP model through simulations and an application to a large galaxy dataset, demonstrating balanced across-group clusters and improved density estimates compared with the hierarchical Dirichlet process, including under model misspecification.
主题: 方法论 (stat.ME)
引用方式: arXiv:2510.14681 [stat.ME]
  (或者 arXiv:2510.14681v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.14681
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Alessandro Carminati [查看电子邮件]
[v1] 星期四, 2025 年 10 月 16 日 13:46:45 UTC (6,281 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号