电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月28日
]
标题: 基于胸部X光片的肺部疾病严重程度分类的深度主动学习:在类别不平衡情况下用更少数据进行学习
标题: Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance
摘要: 为在类别不平衡情况下减少用于胸部X光片(CXRs)肺部疾病严重程度分类所需的标记数据量,本研究应用了带有贝叶斯神经网络(BNN)近似和加权损失函数的深度主动学习。这项回顾性研究收集了2020年1月至11月在埃默里医疗保健附属医院从963名患者(平均年龄,59.2$\pm$16.6岁;481名女性)中获取的2,319张CXRs。所有患者均经临床确诊感染新冠病毒。每张CXR均由3至6名经过认证的放射科医生独立标记为正常、中度或严重。使用主动学习训练了一个具有蒙特卡洛Dropout的深度神经网络来对疾病严重程度进行分类。使用各种采集函数从未标记池中迭代选择最有信息量的样本。性能通过准确率、受试者工作特征曲线下的面积(AU ROC)和精确率-召回率曲线下的面积(AU PRC)进行评估。记录了训练时间和采集时间。统计分析包括描述性指标和不同采集策略之间的性能比较。熵采样在二分类(正常与患病)中使用15.4%的训练数据达到了93.7%的准确率(AU ROC,0.91)。在多类设置中,平均标准差采样使用23.1%的标记数据达到了70.3%的准确率(AU ROC,0.86)。这些方法优于更复杂且计算成本更高的采集函数,并显著减少了标记需求。带有BNN近似和加权损失的深度主动学习有效减少了标记数据需求,同时解决了类别不平衡问题,保持或超过了诊断性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.