电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月8日
]
标题: RadGPT:构建三维图像文本肿瘤数据集
标题: RadGPT: Constructing 3D Image-Text Tumor Datasets
摘要: 每年在美国进行的CT扫描超过8500万次,为放射科医生创建与肿瘤相关的报告是一项具有挑战性和耗时的任务。 为了解决这一需求,我们提出了RadGPT,这是一种解剖感知的视觉-语言AI代理,用于从CT扫描生成详细报告。 RadGPT首先分割肿瘤,包括良性囊肿和恶性肿瘤及其周围的解剖结构,然后将这些信息转换为结构化报告和叙述性报告。 这些报告提供了肿瘤大小、形状、位置、衰减、体积以及与周围血管和器官的相互作用。 在未见过的医院进行的广泛评估表明,RadGPT可以生成准确的报告,对小肿瘤(<2厘米)检测的灵敏度/特异性分别为:肝脏肿瘤80/73%,肾脏肿瘤92/78%,胰腺肿瘤77/77%。 对于大肿瘤,灵敏度范围从89%到97%。 结果显著超过了腹部CT报告生成的最先进水平。 RadGPT为17个公共数据集生成了报告。 通过放射科医生的审查和修改,我们确保了报告的准确性,并创建了第一个公开可用的图像-文本3D医学数据集,包含来自9,262次CT扫描的180万条文本标记和270万张图像,其中包括2,947次肿瘤扫描/报告的8,562次肿瘤实例。 我们的报告可以:(1)在八个肝叶子段和三个胰腺子段中定位肿瘤,并逐体素标注;(2)在260份报告中确定胰腺肿瘤阶段(T1-T4);以及(3)对多个肿瘤进行单独分析——这在人工报告中很少见。 重要的是,948份报告是针对早期肿瘤的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.