电气工程与系统科学 > 图像与视频处理
[提交于 2025年7月17日
]
标题: 冠状动脉分割中视觉基础模型的释放:并行ViT-CNN编码和变分融合
标题: Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion
摘要: 准确的冠状动脉分割对于计算机辅助诊断冠状动脉疾病(CAD)至关重要,但由于血管尺寸小、形态复杂以及与周围组织对比度低,仍然具有挑战性。 为解决这些挑战,我们提出了一种新的分割框架,通过并行编码架构利用视觉基础模型(VFMs)的强大功能。 具体来说,VFM中的视觉变压器(ViT)编码器通过激活最后两个ViT块并集成注意力引导增强(AGE)模块来捕捉全局结构特征,而卷积神经网络(CNN)编码器提取局部细节。 这些互补特征通过跨分支变分融合(CVF)模块进行自适应融合,该模块建模潜在分布并应用变分注意力以分配模态特定权重。 此外,我们引入了一个证据学习不确定性精炼(EUR)模块,该模块使用证据理论量化不确定性,并通过结合多尺度特征聚合和注意力机制来精炼不确定区域,进一步提高分割准确性。 在一项内部数据集和两个公共数据集上的广泛评估表明,所提出的框架显著优于最先进的方法,在准确的冠状动脉分割中表现出色,并展示了在多个数据集上的强大泛化能力。 代码可在 https://github.com/d1c2x3/CAseg 获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.