电气工程与系统科学 > 图像与视频处理
[提交于 2024年11月5日
]
标题: 医学图像分割的基础AI模型
标题: Foundation AI Model for Medical Image Segmentation
摘要: 基础模型是指经过大规模数据训练,并在各种任务上表现出广泛泛化能力且具有高精度的人工智能(AI)模型。这些模型提供了通用的、一通多用或多用途的解决方案,从而避免了开发针对特定任务的AI模型的需求。此类基础模型的例子包括聊天生成预训练转换器(ChatGPT)和分割任意物体模型(SAM)。这些模型已经接受了数百万到数十亿样本的训练,并在许多任务中展示了广泛的准确应用,例如文本处理(使用ChatGPT)和自然图像分割(使用SAM)。在医学图像分割——即在医学图像中寻找目标区域的任务中,存在对这种通用模型日益增长的需求。这类模型可以消除目前需要开发数千个针对特定任务的AI模型的必要性。它们还可以适应那些数据量过小而无法有效训练的任务。我们讨论了实现医学图像分割基础模型的两条途径,并评论了进展、挑战和机遇。一条途径是调整或微调原本为自然图像设计的现有模型,以便用于医学图像;另一条途径是从头开始构建模型,并专门在医学图像上进行训练。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.