定量生物学 > 基因组学
[提交于 2025年1月29日
]
标题: 通过具有松弛边缘约束的最优传输构建细胞类型分类学
标题: Constructing Cell-type Taxonomy by Optimal Transport with Relaxed Marginal Constraints
摘要: 单细胞数据的快速涌现促进了在细胞水平上对许多不同生物条件的研究。聚类分析已被广泛应用于识别细胞类型,在更简洁的形式下捕获原始数据的基本模式。细胞聚类分析的一个挑战是匹配来自不同来源或条件的数据集中的聚类。当在两个样本之间建立对应关系时,许多现有算法无法识别仅存在于两个样本之一中的新细胞类型。此外,当存在超过两个样本时,同时对齐所有样本中的聚类比执行两两对齐更为有利。我们的方法旨在为所有样本中的细胞聚类构建一个分类系统,以更好地注释这些聚类并有效提取下游分析所需的特征。通过结合最优传输(Optimal Transport)与松弛边缘约束(Relaxed Marginal Constraints, OT-RMC)技术以及多样本的同时聚类对齐,开发了一种新的构建细胞类型分类系统的方法。OT-RMC使我们能够解决当样本之间的聚类比例差异很大或者某些聚类不在所有样本中出现时所面临的挑战。在二十多个数据集上的实验表明,由该新系统构建的分类系统可以实现细胞类型的高精度注释。此外,基于分类结果提取的样本级特征可实现样本的准确分类。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.