定量生物学 > 基因组学
[提交于 2025年7月15日
(v1)
,最后修订 2025年7月23日 (此版本, v2)]
标题: SToFM:空间转录组学的多尺度基础模型
标题: SToFM: a Multi-scale Foundation Model for Spatial Transcriptomics
摘要: 空间转录组学(ST)技术通过保留细胞的空间上下文,为生物学家提供了关于单细胞生物学的丰富见解。 为ST构建基础模型可以显著增强对大量和复杂数据源的分析,揭示生物组织复杂性的新视角。 然而,由于需要从包含大量细胞的组织切片中提取多尺度信息,建模ST数据本质上具有挑战性。 这个过程需要整合宏观尺度的组织形态、微观尺度的细胞微环境以及基因尺度的基因表达谱。 为了解决这一挑战,我们提出了SToFM,一个多层次的空间转录组学基础模型。 SToFM首先对每个ST切片进行多尺度信息提取,以构建一组聚合宏观、微观和基因尺度信息的ST子切片。 然后使用SE(2)变换器从子切片中获得高质量的细胞表示。 此外,我们构建了\textbf{SToCorpus-88M},这是最大的高分辨率空间转录组学语料库,用于预训练。 SToFM在多种下游任务中表现出色,例如组织区域语义分割和细胞类型注释,通过捕捉和整合多尺度信息展示了其对ST数据的全面理解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.