计算机科学 > 计算机视觉与模式识别
[提交于 2025年1月3日
]
标题: iCBIR-Sli:具有二维切片嵌入的可解释基于内容的图像检索
标题: iCBIR-Sli: Interpretable Content-Based Image Retrieval with 2D Slice Embeddings
摘要: 当前用于搜索脑部MRI图像的方法依赖于基于文本的方法,这凸显了对基于内容的图像检索(CBIR)系统的重要需求。 直接将3D脑部MRI图像应用于机器学习模型可以有效学习大脑结构;然而,构建通用模型需要大量训练数据。 虽然考虑深度方向并利用连续2D切片的模型在涉及3D数据的分割和分类任务中已显示出成功,但仍存在一些担忧。 具体而言,使用一般的2D切片可能导致忽略深度方向信息中的病理特征和不连续性。 此外,据作者所知,尚未有尝试开发一种能够保留整个大脑结构信息的实际CBIR系统。 在本研究中,我们提出了一种可解释的脑部MRI图像CBIR方法,命名为iCBIR-Sli(基于2D切片嵌入的可解释CBIR),这是全球首次利用一系列2D切片的方法。 iCBIR-Sli通过有效聚合切片信息来解决使用2D切片相关的问题,从而实现了具有高完整性、可用性、鲁棒性和互操作性的低维表示,这些特性对于有效的CBIR至关重要。 在使用五个公开可用的脑部MRI数据集(ADNI2/3,OASIS3/4,AIBL)进行检索评估实验中,针对阿尔茨海默病和认知正常的病例,iCBIR-Sli表现出顶级的检索性能(宏F1=0.859),与专门设计用于分类的现有深度学习模型相当,而无需外部分类器。 此外,该方法通过明确识别与所搜索疾病相关的脑区,提供了高度的可解释性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.