电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月6日
]
标题: 超声-QBench:大型语言模型能否助力超声影像的质量评估?
标题: Ultrasound-QBench: Can LLMs Aid in Quality Assessment of Ultrasound Imaging?
摘要: 随着超声检查数量的急剧增加,由于操作者熟练程度和成像条件的变化,低质量的超声成像逐渐增多,这给诊断准确性带来了严重负担,甚至在危急情况下可能导致诊断需要重新开始。 为了帮助临床医生选择高质量的超声图像并确保准确的诊断,我们引入了Ultrasound-QBench,这是一个全面的基准,系统地评估多模态大型语言模型(MLLMs)在超声图像质量评估任务中的表现。 Ultrasound-QBench建立了两个来自不同来源的数据集: IVUSQA,包含7,709张图像,以及CardiacUltraQA,包含3,863张图像。 这些包含常见超声成像伪影的图像是由专业超声专家标注并分为三个质量级别:高、中、低。 为了更好地评估MLLMs,我们将质量评估任务分解为三个维度:定性分类、定量评分和比较评估。 对7个开源MLLMs以及1个专有MLLMs的评估表明,MLLMs在超声图像质量分类的低级视觉任务中具有初步能力。 我们希望这个基准能够激发研究社区深入探索和提升MLLMs在医学影像任务中尚未开发的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.