定量生物学 > 定量方法
[提交于 2025年1月20日
(v1)
,最后修订 2025年4月2日 (此版本, v3)]
标题: 基于随机游走的scRNA-seq数据超图表示用于改进聚类
标题: Hypergraph Representations of scRNA-seq Data for Improved Clustering with Random Walks
摘要: 对单细胞RNA测序数据的分析通常通过网络投影(如共表达网络)进行,主要是由于下游任务中网络分析工具的丰富可用性。 然而,这种方法有几个局限性:高阶信息的丢失,由于将稀疏数据转换为全连接网络而导致的数据表示效率低下,以及由于零值膨胀导致的共表达估计过高。 为了解决这些限制,我们提出将scRNA-seq表达数据概念化为超图,超图是一种广义图,其中超边可以连接多于两个顶点。 在scRNA-seq数据的背景下,超图的节点代表细胞,边代表基因。 每个超边连接其对应基因活跃表达的所有细胞,并记录该基因在不同细胞中的表达情况。 这种超图概念化使我们能够在不丢失信息的情况下探索共表达网络中的成对相互作用之外的多向关系。 我们提出了两种新的聚类方法:(1) 双重要性偏好超图随机游走(DIPHW)和(2) 共表达与记忆集成的双重要性偏好超图随机游走(CoMem-DIPHW)。 它们在模拟和真实scRNA-seq数据集上均优于现有方法。 当数据模块性较弱时,我们提出的方法带来的改进尤其显著。 此外,CoMem-DIPHW结合了从单细胞丰度计数数据中得到的基因共表达网络、细胞共表达网络以及细胞-基因表达超图,用于嵌入计算。 这种方法同时考虑了来自单细胞水平基因表达的局部信息以及来自两个共表达网络中成对相似性的全局信息。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.