电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月7日
]
标题: 高效准确的结核病诊断:基于注意力残差U-Net和视觉变压器的检测框架
标题: Efficient and Accurate Tuberculosis Diagnosis: Attention Residual U-Net and Vision Transformer Based Detection Framework
摘要: 结核病(TB)是由结核分枝杆菌引起的传染病,尽管可以预防和治愈,但仍然是全球主要的健康威胁。这种负担在低收入和中等收入国家尤其严重。显微镜检查仍然是通过直接观察痰涂片样本中的结核分枝杆菌来诊断TB的关键方法,为早期检测和有效治疗提供了成本效益高的方法。鉴于显微镜检查的工作量大,自动化显微图像中杆菌的检测对于提高TB诊断的速度和可靠性至关重要。目前在明场显微镜痰涂片图像中检测结核杆菌的方法受到有限的自动化能力、不一致的分割质量和受限的分类精度的阻碍。本文提出了一种两阶段的深度学习方法用于结核杆菌检测,包括杆菌分割和分类。在初始阶段,提出了一种采用注意力块和残差连接的先进U-Net模型来分割显微镜痰涂片图像,从而提取感兴趣区域(ROIs)。然后使用定制的Vision Transformer对提取的ROIs进行分类,我们特别将其定制为TBViT以提高图像中杆菌的精确检测。在实验中,使用了一个新开发的显微镜痰涂片图像数据集,该数据集来源于齐尔-尼尔森染色的切片,并与现有的公开数据集结合使用。使用各种指标对实验进行定性和定量评估表明,所提出的模型在分割性能、分类准确率和自动化程度方面均显著优于现有方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.