统计学 > 方法论
[提交于 2025年7月8日
]
标题: 具有维度缩减的FDR控制过程及其在具有连锁不平衡得分的GWAS中的应用
标题: FDR controlling procedures with dimension reduction and their application to GWAS with linkage disequilibrium score
摘要: 全基因组关联研究(GWAS)已经发现了许多与各种表型和复杂疾病相关的单核苷酸多态性(SNPs)。 然而,所识别的遗传变异并不能完全解释复杂特征的遗传力,这就是所谓的缺失遗传力问题。 为了解决这一挑战,并在最大化真实关联的同时准确控制假阳性,我们提出了两种方法,涉及连锁不平衡(LD)分数作为协变量。 我们应用主成分分析(PCA),一种降维技术,以在高维协变量存在的情况下控制错误发现率(FDR)。 这种方法不仅提供了如何在高维中多个协变量影响FDR控制的便捷解释,而且相比不使用协变量的情况,具有更高的统计功效。 此外,我们旨在通过各种模拟实验研究协变量如何提高统计功效,并将结果与实际数据示例进行比较,以获得更好的解释。 使用现实世界的数据集,包括以体重指数(BMI)作为表型的GWAS,我们评估了我们提出的方法的性能。 通过在FDR控制的GWAS分析中引入LD分数作为协变量,我们证明了它们在选择有信息量的LD分数和提高显著SNPs识别方面的有效性。 我们的方法在保留LD分数的基本信息的同时,减轻了计算负担并增强了可解释性。 总体而言,我们的研究有助于推动GWAS中统计方法的发展,并为希望提高遗传关联分析精度的研究人员提供了实用指导。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.