Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2108.07086

帮助 | 高级搜索

统计学 > 方法论

arXiv:2108.07086 (stat)
[提交于 2021年8月16日 ]

标题: 基于质谱的无标记定量蛋白质组学中多重插补引起的变异性用于差异分析

标题: Accounting for multiple imputation-induced variability for differential analysis in mass spectrometry-based label-free quantitative proteomics

Authors:Marie Chion, Christine Carapito, Frédéric Bertrand
摘要: 在无标记定量蛋白质组学中,填补缺失值是一种常见做法。填补的目标是用用户定义的值替换缺失值。然而,由于填补的数据集通常被视为始终完整,因此在填补过程下游可能并未充分考虑填补本身的影响。因此,由于填补而产生的不确定性并未得到充分考虑。我们提供了一种严格的多重填补策略,通过Rubin规则的应用,能够减少参数变异性的偏差估计。随后,基于填补后的肽段强度方差估计器使用贝叶斯分层模型进行调整。最终,该估计器被纳入调整后的t检验统计量中,以提供差异分析的结果。此工作流程可用于定量数据集中的肽段和蛋白水平分析。对于基于肽段水平定量数据的蛋白水平结果,还包括一个聚合步骤。我们的方法名为mi4p,与DAPAR R包中实现的最先进的limma工作流程相比,既适用于模拟数据也适用于真实数据。我们观察到敏感性和特异性之间存在权衡,而在F分数方面,mi4p的整体性能优于DAPAR。
摘要: Imputing missing values is common practice in label-free quantitative proteomics. Imputation aims at replacing a missing value with a user-defined one. However, the imputation itself may not be optimally considered downstream of the imputation process, as imputed datasets are often considered as if they had always been complete. Hence, the uncertainty due to the imputation is not adequately taken into account. We provide a rigorous multiple imputation strategy, leading to a less biased estimation of the parameters' variability thanks to Rubin's rules. The imputation-based peptide's intensities' variance estimator is then moderated using Bayesian hierarchical models. This estimator is finally included in moderated t-test statistics to provide differential analyses results. This workflow can be used both at peptide and protein-level in quantification datasets. For protein-level results based on peptide-level quantification data, an aggregation step is also included. Our methodology, named mi4p, was compared to the state-of-the-art limma workflow implemented in the DAPAR R package, both on simulated and real datasets. We observed a trade-off between sensitivity and specificity, while the overall performance of mi4p outperforms DAPAR in terms of F-Score.
评论: 所述方法学是在R环境中实现的,并可在GitHub上找到:https://github.com/mariechion/mi4p。导致此处呈现结果的R脚本也可以在该存储库中找到。真实数据集可于ProteomeXchange获得,数据集标识符为PXD003841和PXD027800。
主题: 方法论 (stat.ME) ; 定量方法 (q-bio.QM); 应用 (stat.AP)
引用方式: arXiv:2108.07086 [stat.ME]
  (或者 arXiv:2108.07086v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2108.07086
通过 DataCite 发表的 arXiv DOI
期刊参考: Chion M, Carapito C, Bertrand F (2022) Accounting for multiple imputation-induced variability for differential analysis in mass spectrometry-based label-free quantitative proteomics. PLoS Comput Biol 18(8): e1010420
相关 DOI: https://doi.org/10.1371/journal.pcbi.1010420
链接到相关资源的 DOI

提交历史

来自: Marie Chion [查看电子邮件]
[v1] 星期一, 2021 年 8 月 16 日 13:40:35 UTC (353 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2021-08
切换浏览方式为:
q-bio
q-bio.QM
stat
stat.AP

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号