定量生物学 > 基因组学
[提交于 2025年6月11日
]
标题: HEIST:一种用于空间转录组学和蛋白质组学数据的图基础模型
标题: HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data
摘要: 单细胞转录组学已成为数据驱动的生物学洞见的重要来源,使利用先进的深度学习方法来理解细胞异质性和单细胞水平上的转录调控成为可能。 随着空间转录组学数据的到来,我们有望了解组织环境中细胞的信息,因为它同时提供了空间坐标和转录组读出信息。 然而,现有的模型要么忽略了空间分辨率,要么忽略了基因调控信息。 细胞中的基因调控会根据周围细胞的微环境线索而改变,但现有的模型忽视了具有不同抽象层次之间层级依赖关系的基因调控模式。 为了从空间转录组学数据中创建细胞和基因的上下文表示,我们引入了HEIST,这是一种基于分层图Transformer的空间转录组学和蛋白质组学数据的基础模型。 HEIST将组织建模为空间细胞邻域图,每个细胞反过来被建模为一个基因调控网络图。 该框架包括一个分层图Transformer,它执行跨层次的消息传递以及同一层次内的消息传递。 HEIST使用15个器官的124种组织中的2230万个细胞,在空间感知对比学习和掩码自动编码目标下进行了预训练。 对HEIST细胞表示的无监督分析表明,它能够有效地编码细胞嵌入中的微环境影响,从而发现先前模型无法区分的空间信息子群。 此外,HEIST在四个下游任务上取得了最先进的结果,包括临床结果预测、细胞类型注释、基因填补和多种技术下的空间信息细胞聚类,突出了分层建模和基于GRN表示的重要性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.