Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2508.21263

帮助 | 高级搜索

电气工程与系统科学 > 图像与视频处理

arXiv:2508.21263 (eess)
[提交于 2025年8月28日 ]

标题: 基于胸部X光片的肺部疾病严重程度分类的深度主动学习:在类别不平衡情况下用更少数据进行学习

标题: Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance

Authors:Roy M. Gabriel, Mohammadreza Zandehshahvar, Marly van Assen, Nattakorn Kittisut, Kyle Peters, Carlo N. De Cecco, Ali Adibi
摘要: 为在类别不平衡情况下减少用于胸部X光片(CXRs)肺部疾病严重程度分类所需的标记数据量,本研究应用了带有贝叶斯神经网络(BNN)近似和加权损失函数的深度主动学习。这项回顾性研究收集了2020年1月至11月在埃默里医疗保健附属医院从963名患者(平均年龄,59.2$\pm$16.6岁;481名女性)中获取的2,319张CXRs。所有患者均经临床确诊感染新冠病毒。每张CXR均由3至6名经过认证的放射科医生独立标记为正常、中度或严重。使用主动学习训练了一个具有蒙特卡洛Dropout的深度神经网络来对疾病严重程度进行分类。使用各种采集函数从未标记池中迭代选择最有信息量的样本。性能通过准确率、受试者工作特征曲线下的面积(AU ROC)和精确率-召回率曲线下的面积(AU PRC)进行评估。记录了训练时间和采集时间。统计分析包括描述性指标和不同采集策略之间的性能比较。熵采样在二分类(正常与患病)中使用15.4%的训练数据达到了93.7%的准确率(AU ROC,0.91)。在多类设置中,平均标准差采样使用23.1%的标记数据达到了70.3%的准确率(AU ROC,0.86)。这些方法优于更复杂且计算成本更高的采集函数,并显著减少了标记需求。带有BNN近似和加权损失的深度主动学习有效减少了标记数据需求,同时解决了类别不平衡问题,保持或超过了诊断性能。
摘要: To reduce the amount of required labeled data for lung disease severity classification from chest X-rays (CXRs) under class imbalance, this study applied deep active learning with a Bayesian Neural Network (BNN) approximation and weighted loss function. This retrospective study collected 2,319 CXRs from 963 patients (mean age, 59.2 $\pm$ 16.6 years; 481 female) at Emory Healthcare affiliated hospitals between January and November 2020. All patients had clinically confirmed COVID-19. Each CXR was independently labeled by 3 to 6 board-certified radiologists as normal, moderate, or severe. A deep neural network with Monte Carlo Dropout was trained using active learning to classify disease severity. Various acquisition functions were used to iteratively select the most informative samples from an unlabeled pool. Performance was evaluated using accuracy, area under the receiver operating characteristic curve (AU ROC), and area under the precision-recall curve (AU PRC). Training time and acquisition time were recorded. Statistical analysis included descriptive metrics and performance comparisons across acquisition strategies. Entropy Sampling achieved 93.7% accuracy (AU ROC, 0.91) in binary classification (normal vs. diseased) using 15.4% of the training data. In the multi-class setting, Mean STD sampling achieved 70.3% accuracy (AU ROC, 0.86) using 23.1% of the labeled data. These methods outperformed more complex and computationally expensive acquisition functions and significantly reduced labeling needs. Deep active learning with BNN approximation and weighted loss effectively reduces labeled data requirements while addressing class imbalance, maintaining or exceeding diagnostic performance.
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI); 机器学习 (cs.LG)
引用方式: arXiv:2508.21263 [eess.IV]
  (或者 arXiv:2508.21263v1 [eess.IV] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.21263
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Roy Gabriel [查看电子邮件]
[v1] 星期四, 2025 年 8 月 28 日 23:29:56 UTC (3,339 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
查看许可
当前浏览上下文:
eess.IV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.AI
cs.LG
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号