定量生物学 > 细胞行为
[提交于 2025年6月25日
]
标题: scMamba:一种超越高度可变特征选择的单细胞多组学整合的可扩展基础模型
标题: scMamba: A Scalable Foundation Model for Single-Cell Multi-Omics Integration Beyond Highly Variable Feature Selection
摘要: 单细胞多组学技术的出现使得在单个细胞内同时分析多种组学层面成为可能。 整合这种多模态数据为细胞身份、调控过程和疾病机制提供了前所未有的见解。 然而,这仍然具有挑战性,因为当前的方法通常依赖于在预处理过程中选择高变异基因或峰,这可能会无意中丢弃关键的生物学信息。 在此,我们提出了 scMamba,这是一种基础模型,旨在无需先验特征选择的情况下整合单细胞多组学数据,同时保留基因组位置信息。 scMamba 引入了一种基于块的细胞标记化策略,将基因组区域视为单词(标记),将细胞视为句子。 基于状态空间对偶性的概念,scMamba 从高维、稀疏的单细胞多组学数据中提炼出丰富的生物学见解。 此外,我们新颖的对比学习方法,结合余弦相似性正则化,相比传统方法在跨组学层面对齐方面表现出色。 在多个数据集上的系统基准测试表明,scMamba 在保持生物学变异、对齐组学层次以及增强关键下游任务(如聚类、细胞类型注释和轨迹推断)方面显著优于最先进的方法。 我们的研究结果使 scMamba 成为一个强大的工具,用于大规模单细胞多组学整合,能够处理大规模图谱并推动生物学发现。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.