电气工程与系统科学 > 图像与视频处理
[提交于 2025年6月14日
]
标题: 在边缘设备上部署和评估用于糖尿病视网膜病变检测的多种深度学习模型
标题: Deploying and Evaluating Multiple Deep Learning Models on Edge Devices for Diabetic Retinopathy Detection
摘要: 糖尿病视网膜病变(DR)是糖尿病患者视力损伤的主要原因,全球约有34.6%的糖尿病患者受到影响,预计到2045年病例数将达到2.42亿。 传统的DR诊断依赖于视网膜眼底图像的手动检查,这种方法既耗时又资源密集。 本研究提出了一种使用Edge Impulse在边缘设备上部署多个深度学习模型以实现实时DR检测的新解决方案。 一个包含超过3,662张视网膜眼底图像的强大数据集,来源于Kaggle EyePACS数据集,并通过包括增强和归一化在内的预处理技术进行了整理和优化。 利用TensorFlow,设计、训练并优化了多种卷积神经网络(CNNs),如MobileNet、ShuffleNet、SqueezeNet以及一个自定义的深度神经网络(DNN),以适应边缘部署。 这些模型被转换为TensorFlowLite并量化为8位整数,以减小模型大小并提高推理速度,同时在准确率上的折衷最小。 在不同边缘硬件平台(包括智能手机和微控制器)上的性能评估突出了推断速度、准确率、精度和资源利用率等关键指标。 MobileNet实现了96.45%的准确率,而SqueezeNet凭借仅为176 KB的小模型尺寸和GPU上仅17毫秒的延迟,展示了强大的实时性能。 ShuffleNet和自定义DNN取得了适中的准确率,但在资源效率方面表现出色,使其适用于低端设备。 这种将边缘AI技术整合到医疗保健中的方式为早期DR检测提供了一个可扩展且具有成本效益的解决方案,特别是在资源匮乏和偏远的医疗环境中,能够提供及时且准确的诊断。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.