电气工程与系统科学 > 图像与视频处理
[提交于 2024年11月1日
]
标题: 跨眼底变压器用于白内障的多模态糖尿病视网膜病变分级
标题: Cross-Fundus Transformer for Multi-modal Diabetic Retinopathy Grading with Cataract
摘要: 糖尿病视网膜病变(DR)是全球失明的主要原因之一,也是糖尿病的常见并发症。 作为两种不同的DR分级成像工具,彩色眼底摄影(CFP)和红外眼底摄影(IFP)在临床应用中高度相关且互补。 据我们所知,这是首次研究探索一种新的多模态深度学习框架,以融合CFP和IFP的信息,从而实现更准确的DR分级。 具体来说,我们构建了一个双流架构——跨眼底Transformer(CFT),用于融合基于ViT的两种眼底图像模态特征。 特别是,引入了一个精心设计的跨眼底注意(CFA)模块,以捕捉CFP和IFP图像之间的对应关系。 此外,我们采用单模态和多模态监督,以最大化DR分级的整体性能。 在由1,713对多模态眼底图像组成的临床数据集上的广泛实验表明了我们提出方法的优势。 我们的代码将公开发布。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.