电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月28日
]
标题: 用于医学图像分割的SAM高效知识蒸馏
标题: Efficient Knowledge Distillation of SAM for Medical Image Segmentation
摘要: 《任意物体分割模型》(SAM)在交互式图像分割领域树立了新的标杆,在各种任务中表现出稳健的性能。然而,其较高的计算需求限制了它在实时或资源受限环境中的部署。 为了解决这些挑战,我们提出了一种新颖的知识蒸馏方法,即KD SAM,该方法通过均方误差(MSE)和感知损失的结合来优化编码器和解码器。此双损失框架捕捉结构和语义特征,使学生模型能够在降低计算复杂度的同时保持高分割精度。 基于在包括Kvasir-SEG、ISIC 2017、胎儿头部超声波和乳腺超声波在内的数据集上的模型评估,我们展示了KD SAM与基线模型相比具有可比或更优的性能,但参数显著减少。 KD SAM有效地平衡了分割准确性和计算效率,使其非常适合资源受限环境下的实时医学图像分割应用。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.