定量生物学 > 种群与进化
[提交于 2011年7月25日
]
标题: 边缘主成分和挤压聚类:利用系统发育定位数据的特殊结构进行样本比较
标题: Edge principal components and squash clustering: using the special structure of phylogenetic placement data for sample comparison
摘要: 主成分分析(PCA)和层次聚类是分析从给定环境中采样的核酸序列样本之间差异的最常用技术之一。 然而,将这些技术应用于样本之间的距离的经典方法可能缺乏透明度,因为经典PCA图中的轴没有直接的解释,而且很难为基于距离的层次聚类方法(如UPGMA)生成的树的内部节点或边长赋予明确的直观意义。 我们表明,通过利用系统发育定位数据的特殊结构,两种新方法可以产生更有意思且可解释的结果。 边主成分分析能够检测包含密切相关的分类群的样本之间的显著差异。 每个主成分轴只是系统发育树边上的有符号权重的集合,这些权重可以通过对边进行适当的加粗和着色来轻松可视化。 压平聚类输出一个(根化的)聚类树,其中每个内部节点对应于该节点下方叶样本的适当“平均”。 此外,边的长度是与两个相邻节点相关联的平均样本之间的适当定义的距离,而不是UPGMA产生的距离的不太易解释的平均值。 我们介绍了这些方法,并用人类阴道微生物组的数据说明了它们的应用。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.