Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > q-bio > arXiv:1209.1341

帮助 | 高级搜索

定量生物学 > 定量方法

arXiv:1209.1341 (q-bio)
[提交于 2012年9月6日 (v1) ,最后修订 2012年11月14日 (此版本, v2)]

标题: 基于贝叶斯稀疏线性混合模型的多基因建模

标题: Polygenic Modeling with Bayesian Sparse Linear Mixed Models

Authors:Xiang Zhou, Peter Carbonetto, Matthew Stephens
摘要: 线性混合模型(LMMs)和稀疏回归模型在遗传学应用中被广泛使用,包括最近在全基因组关联研究中的多基因建模。 这两种方法做出了非常不同的假设,因此预计在不同情况下表现良好。 然而,在实践中,对于给定的数据集,通常不知道哪种假设会更准确。 受此启发,我们考虑了这两种方法的混合,我们称之为“贝叶斯稀疏线性混合模型”(BSLMM),它包括这两种模型作为特例。 我们解决了应用BSLMM时出现的几个关键计算和统计问题,包括对超参数的适当先验规范,以及用于后验推断的新型马尔可夫链蒙特卡罗算法。 我们将BSLMM应用于两种多基因建模应用,并与其他方法进行比较:估计可用基因型解释的表型方差比例(PVE),以及表型(或育种值)预测。 在PVE估计方面,我们证明了BSLMM结合了标准LMMs和稀疏回归建模的优点。 在表型预测方面,它显著优于其他两种方法,以及之前为此问题提出的几种大规模回归方法。 实现我们方法的软件可以从 http://stephenslab.uchicago.edu/software.html 免费获得。
摘要: Both linear mixed models (LMMs) and sparse regression models are widely used in genetics applications, including, recently, polygenic modeling in genome-wide association studies. These two approaches make very different assumptions, so are expected to perform well in different situations. However, in practice, for a given data set one typically does not know which assumptions will be more accurate. Motivated by this, we consider a hybrid of the two, which we refer to as a "Bayesian sparse linear mixed model" (BSLMM) that includes both these models as special cases. We address several key computational and statistical issues that arise when applying BSLMM, including appropriate prior specification for the hyper-parameters, and a novel Markov chain Monte Carlo algorithm for posterior inference. We apply BSLMM and compare it with other methods for two polygenic modeling applications: estimating the proportion of variance in phenotypes explained (PVE) by available genotypes, and phenotype (or breeding value) prediction. For PVE estimation, we demonstrate that BSLMM combines the advantages of both standard LMMs and sparse regression modeling. For phenotype prediction it considerably outperforms either of the other two methods, as well as several other large-scale regression methods previously suggested for this problem. Software implementing our method is freely available from http://stephenslab.uchicago.edu/software.html
主题: 定量方法 (q-bio.QM) ; 基因组学 (q-bio.GN); 应用 (stat.AP); 方法论 (stat.ME)
引用方式: arXiv:1209.1341 [q-bio.QM]
  (或者 arXiv:1209.1341v2 [q-bio.QM] 对于此版本)
  https://doi.org/10.48550/arXiv.1209.1341
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Xiang Zhou [查看电子邮件]
[v1] 星期四, 2012 年 9 月 6 日 16:48:45 UTC (1,570 KB)
[v2] 星期三, 2012 年 11 月 14 日 22:30:27 UTC (2,476 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
q-bio.QM
< 上一篇   |   下一篇 >
新的 | 最近的 | 2012-09
切换浏览方式为:
q-bio
q-bio.GN
stat
stat.AP
stat.ME

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号