计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月16日
]
标题: CytoSAE:用于血液学的可解释细胞嵌入
标题: CytoSAE: Interpretable Cell Embeddings for Hematology
摘要: 稀疏自编码器(SAEs)作为一种有前景的工具,用于基于变压器的基础模型的机制可解释性。 最近,SAEs也被应用于视觉领域,使得能够发现视觉概念并将它们逐补丁地归因于变压器模型中的标记。 虽然越来越多的基础模型被用于医学影像,但解释其推理的工具仍然缺乏。 在本工作中,我们展示了SAEs在血液学中的适用性。 我们提出了CytoSAE,一种在超过40,000张外周血单细胞图像上训练的稀疏自编码器。 CytoSAE可以推广到各种和域外的数据集,包括骨髓细胞学,在其中它识别出形态学相关的概念,我们通过医学专家进行了验证。 此外,我们展示了CytoSAE可以生成患者特异性和疾病特异性的概念的情况,从而能够在补丁级别检测特征性细胞和局部细胞异常。 我们量化了概念对患者级AML亚型分类任务的影响,并表明CytoSAE的概念在性能上与最先进方法相当,同时在亚细胞水平上提供可解释性。 源代码和模型权重可在https://github.com/dynamical-inference/cytosae获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.