电气工程与系统科学 > 图像与视频处理
[提交于 2025年7月13日
]
标题: 使用通用分割模型进行医学图像的标志性检测
标题: Landmark Detection for Medical Images using a General-purpose Segmentation Model
摘要: 放射图像在骨科医学诊断中是核心工具,解剖标志点检测作为信息提取的关键中间步骤。 通用基础分割模型,如SAM(Segment Anything Model),默认不支持标志点分割,需要提示才能运行。 然而,在医学影像中,标志点的提示非常具体。 由于SAM未接受过此类标志点的训练,因此无法为诊断目的生成准确的标志点分割。 即使MedSAM,SAM的医学适应变体,也仅被训练用于识别较大的解剖结构,如器官及其部分,缺乏骨科骨盆标志点所需的细粒度精度。 为解决这一限制,我们提出利用另一个通用的非基础模型:YOLO。 YOLO在目标检测方面表现出色,可以提供作为SAM输入提示的边界框。 虽然YOLO在检测方面效率高,但在分割复杂结构方面明显不如SAM。 结合使用,这两个模型形成了一条可靠的流水线,能够分割不仅包括八个解剖标志点的小型试点集,还包括72个标志点和16个具有复杂轮廓的区域,如股骨皮质骨和骨盆入口。 通过使用YOLO生成的边界框引导SAM,我们训练了混合模型以准确分割骨科骨盆X射线图像。 我们的结果表明,所提出的YOLO和SAM组合在检测骨科骨盆X射线图像中的解剖标志点和复杂轮廓方面表现出色。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.