定量生物学 > 定量方法
[提交于 2025年1月29日
]
标题: 多组学数据整合方法的技术综述:从经典统计方法到深度生成方法
标题: A technical review of multi-omics data integration methods: from classical statistical to deep generative approaches
摘要: 高通量测序和其他检测技术的快速发展导致了大型和复杂的多组学数据集的生成,为推进精准医学策略提供了前所未有的机会。 然而,由于数据类型之间的高维度、异质性、实验缺口以及缺失值的频率,多组学数据整合面临着重大挑战。 计算方法已被开发用于解决这些问题,采用统计和机器学习方法来揭示复杂的生物模式,并提供对我们理解疾病机制的更深入见解。 在此,我们全面回顾了最先进的多组学数据整合方法,重点介绍了深度生成模型,特别是广泛用于数据填补和增强、联合嵌入创建和批次效应校正的变分自编码器(VAEs)。 我们探讨了损失函数和正则化技术的技术方面,包括对抗训练、解缠和对比学习。 此外,我们讨论了基础模型的最新进展以及新兴数据模态的整合,同时描述了当前的局限性,并概述了增强生物医学研究中多模态方法的未来方向。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.