统计学 > 方法论
[提交于 2022年5月2日
(v1)
,最后修订 2023年3月9日 (此版本, v2)]
标题: 使用非局部分布混合物的多重假设筛查及其在基因组研究中的应用
标题: Multiple hypothesis screening using mixtures of non-local distributions with applications to genomic studies
摘要: 大规模数据集的分析,尤其是在生物医学背景下,通常涉及多个假设的原则性筛选。著名的两组模型通过混合两种竞争密度(零假设和备择假设分布)共同对检验统计量的分布进行建模。 我们研究了使用加权密度(特别是非局部密度)作为工作备择分布的可能性,以强制区分零假设并因此改进筛选过程。我们展示了这些加权备择分布如何在固定混合比例的情况下,相对于局部无权重似然方法,改善各种操作特性(例如贝叶斯错误发现率)。 提出了参数化和非参数化的模型规范,并提供了高效的后验推理抽样器。通过模拟研究,我们展示了我们的模型与已建立的以及最先进的替代方法在各种操作特性方面的比较情况。 最后,为了展示我们方法的多功能性,我们使用来自基因组学异质研究的公开数据集进行了三项差异表达分析。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.