Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:1702.04808

帮助 | 高级搜索

统计学 > 应用

arXiv:1702.04808 (stat)
[提交于 2017年2月15日 ]

标题: 一种成对多项数据模型及其在分类树数据上的应用

标题: A Model for Paired-Multinomial Data and Its Application to Analysis of Data on a Taxonomic Tree

Authors:Pixu Shi, Hongzhe Li
摘要: 在人体微生物组研究中,测序读数数据通常被汇总为各种分类水平的细菌分类单元的计数,这些分类水平由分类树指定。 本文考虑了从同一受试者处收集的微生物组数据的两次重复测量分析问题。 此类数据通常用于评估某种治疗后的微生物组成变化,或不同身体部位之间的微生物组成差异。 现有针对此类计数数据的模型在建模计数的协方差结构以及处理配对多项计数数据方面存在局限性。 提出了一种适用于配对多项计数数据的新概率分布,该分布允许灵活的协方差结构,并可用于建模重复测量的多变量计数数据。 基于此分布,开发了一个检验统计量,用于基于配对多项计数数据测试组成差异。 所提出的检验可以应用于分类树上的计数数据,以测试微生物组组成的差异并识别具有不同子组成的子树。 模拟结果表明,与一些常用方法相比,所提出的检验具有正确的第一类错误率和更高的功效。 使用上呼吸道微生物组数据集的分析来说明所提出的方法。
摘要: In human microbiome studies, sequencing reads data are often summarized as counts of bacterial taxa at various taxonomic levels specified by a taxonomic tree. This paper considers the problem of analyzing two repeated measurements of microbiome data from the same subjects. Such data are often collected to assess the change of microbial composition after certain treatment, or the difference in microbial compositions across body sites. Existing models for such count data are limited in modeling the covariance structure of the counts and in handling paired multinomial count data. A new probability distribution is proposed for paired-multinomial count data, which allows flexible covariance structure and can be used to model repeatedly measured multivariate count data. Based on this distribution, a test statistic is developed for testing the difference in compositions based on paired multinomial count data. The proposed test can be applied to the count data observed on a taxonomic tree in order to test difference in microbiome compositions and to identify the subtrees with different subcompositions. Simulation results indicate that proposed test has correct type 1 errors and increased power compared to some commonly used methods. An analysis of an upper respiratory tract microbiome data set is used to illustrate the proposed methods.
主题: 应用 (stat.AP)
引用方式: arXiv:1702.04808 [stat.AP]
  (或者 arXiv:1702.04808v1 [stat.AP] 对于此版本)
  https://doi.org/10.48550/arXiv.1702.04808
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Pixu Shi [查看电子邮件]
[v1] 星期三, 2017 年 2 月 15 日 22:50:27 UTC (665 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.AP
< 上一篇   |   下一篇 >
新的 | 最近的 | 2017-02
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号