统计学 > 方法论
[提交于 2016年4月1日
]
标题: 推断非正态和混合离散-连续基因组数据的网络结构
标题: Inferring network structure in non-normal and mixed discrete-continuous genomic data
摘要: 通过无向图推断依赖结构对于揭示可能与癌症相关的高维基因组标记之间的主要多变量交互模式至关重要。 传统上,条件独立性通常使用稀疏高斯图模型(适用于连续数据)和稀疏Ising模型(适用于离散数据)进行研究。 然而,存在两种明显的情况,这些方法显得不足。 第一种情况发生在数据为连续型但表现出非正态边缘行为时,例如厚尾或偏斜,这使得正态性假设不适用。 第二种情况发生在数据部分为有序或离散型(例如突变的存在与否),而另一部分为连续型(例如基因或蛋白质的表达水平)时。 在这种情况下,现有的贝叶斯方法通常采用潜在变量框架处理离散部分,从而无法推断实际观测数据间的条件独立性。 本文在统一框架下克服了这两个挑战,采用了高斯比例混合模型。 我们的框架能够处理非正态的连续数据以及混合连续和离散型数据,同时仍然能够推断观测数据中的稀疏条件符号独立性结构。 模拟中的广泛性能对比与真实癌症基因组数据集的分析表明,所提出的方法的有效性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.