电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月27日
]
标题: 利用视频视觉变压器从3D脑部MRI进行阿尔茨海默病诊断
标题: Leveraging Video Vision Transformer for Alzheimer's Disease Diagnosis from 3D Brain MRI
摘要: 阿尔茨海默病(AD)是一种影响全球数百万人的神经退行性疾病,需要早期和准确的诊断以实现最佳患者管理。近年来,深度学习的进步在医学图像分析中显示出显著的潜力。方法 在这项研究中,我们提出了“ViTranZheimer”,一种利用视频视觉变压器分析3D脑部MRI数据的AD诊断方法。通过将3D MRI体积视为视频,我们利用切片之间的时序依赖性来捕捉复杂的结构关系。视频视觉变压器的自注意力机制使模型能够学习长距离依赖关系并识别可能表明AD进展的细微模式。我们提出的深度学习框架旨在提高AD诊断的准确性和敏感性,为临床医生提供一种用于早期检测和干预的工具。我们使用ADNI数据集验证了视频视觉变压器的性能,并与其他相关模型进行了比较分析。结果 所提出的ViTranZheimer模型与两个混合模型CNN-BiLSTM和ViT-BiLSTM进行了比较。CNN-BiLSTM是卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)的组合,而ViT-BiLSTM是视觉变压器(ViT)与BiLSTM的组合。ViTranZheimer、CNN-BiLSTM和ViT-BiLSTM模型达到的准确率分别为98.6%、96.479%和97.465%。ViTranZheimer在准确率方面达到最高值98.6%,在该评估指标上优于其他模型,表明其在该特定评估指标上的优越性能。结论 这项研究推进了深度学习技术在神经影像学和阿尔茨海默病研究中的应用理解,为更早和更少侵入性的临床诊断铺平了道路。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.