统计学 > 方法论
[提交于 2025年7月21日
]
标题: 多重假设检验以估计随机块模型中的社区数量
标题: Multiple Hypothesis Testing To Estimate The Number Of Communities in Stochastic Block Models
摘要: 单细胞RNA测序(scRNA-seq)数据集的聚类可以为细胞的生物功能提供关键见解。因此,使用基于网络的社区检测方法(一种更好的聚类方法)对scRNA-seq数据集进行聚类越来越普遍。在将基于网络的社区检测方法应用于scRNA-seq数据集时,主要挑战是这些方法\emph{先验}需要真实的社区或块的数量来估计社区成员身份。尽管已有用于估计社区数量的方法,但它们不适用于噪声较大的scRNA-seq数据集。此外,我们需要一种合适的方法从scRNA-seq数据集中提取合适的网络。为了解决这些问题,我们提出了一种两步解决方案:i) 一种简单的基于似然的方法,用于从scRNA-seq数据集中提取随机块模型(SBMs),ii) 一种新的顺序多重检验(SMT)方法,用于估计SBMs中的社区数量。我们研究了SMT的理论性质,并在中等稀疏条件下建立了其一致性。此外,我们将SMT的数值性能与几种现有方法进行了比较。我们还表明,我们的方法在基准scRNA-seq数据集上估计社区数量方面与现有方法相比表现良好。最后,我们使用我们的方法来估计人类视网膜双极细胞单细胞数据集的子群。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.