计算机科学 > 机器学习
[提交于 2025年7月14日
]
标题: 软图聚类用于单细胞RNA测序数据
标题: Soft Graph Clustering for single-cell RNA Sequencing Data
摘要: 聚类分析在单细胞RNA测序(scRNA-seq)数据分析中是基础性的,用于阐明细胞的异质性和多样性。最近基于图的scRNA-seq聚类方法,特别是图神经网络(GNNs),在解决高维、高稀疏性和频繁的丢失事件导致的细胞群体边界模糊等挑战方面有了显著提高。然而,它们依赖于从阈值相似性矩阵得出的硬图结构,这带来了以下挑战:(i) 通过应用阈值将细胞间关系简化为二进制边(0或1),这限制了细胞间连续相似特征的捕捉,并导致显著的信息丢失。(ii) 硬图中存在显著的跨簇连接,这可能混淆依赖于图结构的GNN方法,可能导致错误的信息传播和偏差的聚类结果。为了解决这些挑战,我们引入了scSGC,一种用于单细胞RNA测序数据的软图聚类方法,旨在通过非二进制边权重更准确地表征细胞间的连续相似性,从而缓解刚性数据结构的局限性。scSGC框架包括三个核心组件:(i) 基于零膨胀负二项式(ZINB)的特征自编码器;(ii) 双通道剪切信息引导的软图嵌入模块;以及(iii) 基于最优传输的聚类优化模块。在十个数据集上的广泛实验表明,scSGC在聚类准确性、细胞类型注释和计算效率方面优于13种最先进的聚类模型。这些结果突显了其在推进scRNA-seq数据分析和加深对细胞异质性理解方面的巨大潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.