计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月21日
]
标题: GeMix:基于条件GAN的混合方法用于改进医学图像增强
标题: GeMix: Conditional GAN-Based Mixup for Improved Medical Image Augmentation
摘要: 混补已成为图像分类的一种流行增强策略,但其简单的像素级插值经常产生不现实的图像,这可能阻碍学习,尤其是在高风险的医疗应用中。 我们提出了GeMix,一种两阶段框架,用由类别条件GAN驱动的学习的、标签感知的插值替代启发式混合。 首先,在目标数据集上训练一个StyleGAN2-ADA生成器。 在增强过程中,我们从偏向不同类别的Dirichlet先验中采样两个标签向量,并通过Beta分布的系数进行混合。 然后,我们将生成器条件设置为这个软标签,以合成沿连续类别流形的视觉连贯图像。 我们在大规模的COVIDx-CT-3数据集上对GeMix进行了基准测试,使用了三种主干网络(ResNet-50,ResNet-101,EfficientNet-B0)。 当与真实数据结合时,我们的方法在所有主干网络上都提高了宏F1分数,降低了新冠检测的假阴性率。 因此,GeMix是像素空间混补的即插即用替代方案,提供了更强的正则化和更高的语义保真度,而不会干扰现有的训练流程。 我们公开发布我们的代码https://github.com/hugocarlesso/GeMix以促进可重复性和进一步研究。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.