Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2501.03466v1

帮助 | 高级搜索

电气工程与系统科学 > 图像与视频处理

arXiv:2501.03466v1 (eess)
[提交于 2025年1月7日 ]

标题: DGSSA:用于视网膜血管分割的结构和风格增强领域泛化

标题: DGSSA: Domain generalization with structural and stylistic augmentation for retinal vessel segmentation

Authors:Bo Liu, Yudong Zhang, Shuihua Wang, Siyue Li, Jin Hong
摘要: 视网膜血管形态对于诊断糖尿病、青光眼和高血压等疾病至关重要,因此准确分割视网膜血管对于早期干预至关重要。 传统的分割方法假设训练数据和测试数据具有相似的分布,由于成像设备和患者人口统计学的变化导致领域转移,这可能导致在未见领域上的性能不佳。 本文提出了一种新颖的方法DGSSA,用于视网膜血管图像分割,通过结合结构和风格增强策略来提高模型的泛化能力。 我们利用空间占领算法生成多样化的类似血管结构,这些结构能够紧密模仿实际的视网膜血管,然后使用改进的Pix2Pix模型生成伪视网膜图像,使分割模型能够学习更广泛的结构分布。 此外,我们利用PixMix实现随机的光度增强,并引入不确定性扰动,从而丰富风格多样性,并显著提高模型对不同成像条件的适应能力。 我们的框架在四个具有挑战性的数据集-DRIVE、CHASEDB、HRF和STARE上进行了严格评估,展示了超越现有方法的最先进性能。 这验证了我们所提出方法的有效性,突显了其在自动视网膜血管分析中的临床应用潜力。
摘要: Retinal vascular morphology is crucial for diagnosing diseases such as diabetes, glaucoma, and hypertension, making accurate segmentation of retinal vessels essential for early intervention. Traditional segmentation methods assume that training and testing data share similar distributions, which can lead to poor performance on unseen domains due to domain shifts caused by variations in imaging devices and patient demographics. This paper presents a novel approach, DGSSA, for retinal vessel image segmentation that enhances model generalization by combining structural and style augmentation strategies. We utilize a space colonization algorithm to generate diverse vascular-like structures that closely mimic actual retinal vessels, which are then used to generate pseudo-retinal images with an improved Pix2Pix model, allowing the segmentation model to learn a broader range of structure distributions. Additionally, we utilize PixMix to implement random photometric augmentations and introduce uncertainty perturbations, thereby enriching stylistic diversity and significantly enhancing the model's adaptability to varying imaging conditions. Our framework has been rigorously evaluated on four challenging datasets-DRIVE, CHASEDB, HRF, and STARE-demonstrating state-of-the-art performance that surpasses existing methods. This validates the effectiveness of our proposed approach, highlighting its potential for clinical application in automated retinal vessel analysis.
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2501.03466 [eess.IV]
  (或者 arXiv:2501.03466v1 [eess.IV] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.03466
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Jin Hong [查看电子邮件]
[v1] 星期二, 2025 年 1 月 7 日 01:47:57 UTC (1,106 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
查看许可
当前浏览上下文:
eess.IV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
cs.CV
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号