统计学 > 方法论
[提交于 2015年12月13日
(v1)
,最后修订 2016年4月25日 (此版本, v2)]
标题: 非迭代联合和个体变异解释
标题: Non-iterative Joint and Individual Variation Explained
摘要: 对在共同实验样本上测量的异构数据块进行综合分析是现代数据分析中的一个主要挑战。 这种数据结构自然地促使同时探索每个数据块中的联合和个体变化,从而产生新的见解。 例如,人们迫切希望整合《癌症基因组图谱》(TCGA)中的多个基因组数据集,以描述每个来源的癌症遗传学和细胞生物学的共性和独特方面。 在本文中,我们引入了非迭代联合和个体变异解释(Non-iterative JIVE),能够捕捉每个数据块中的联合和个体变异。 这在概念理解、对数据异质性的更好适应以及快速的线性代数计算方面是对这一挑战早期方法的重大改进。 重要的数学贡献是使用得分子空间作为变化结构的主要描述符,以及使用扰动理论作为变化分割的指导。 这导致了一种方法,在不需要归一化的情况下,对数据块之间的异质性具有鲁棒性。 对TCGA数据的应用揭示了每种信号在表征肿瘤亚型中的不同行为。 对死亡率数据集的应用揭示了有趣的的历史教训。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.