计算机科学 > 计算机视觉与模式识别
[提交于 2024年11月25日
]
标题: 使用半监督伪标签和从多样化PET/CT数据集学习的增强型肺癌生存预测
标题: Enhanced Lung Cancer Survival Prediction using Semi-Supervised Pseudo-Labeling and Learning from Diverse PET/CT Datasets
摘要: 目标:本研究探索了一种使用多样化数据集的半监督学习(SSL)伪标签策略,以提升肺癌(LCa)生存预测性能,并分析来自PET/CT扫描的手工特征和深度影像组学特征(HRF/DRF),通过混合机器学习系统(HMLS)。 方法:我们收集了199名同时拥有PET和CT图像的LCa患者,这些数据来自癌症影像档案库(TCIA)和本地数据库,同时从TCIA获得了408名头颈癌(HNCa)的PET/CT图像。 我们在ViSERA软件中,通过PySERA和3D自动编码器,分别提取了215个HRF和1024个DRF,这些特征来自分割后的原发肿瘤。 监督策略(SL)采用HMLSs: PCA连接到HRF和DRF上的4个分类器。 SSL策略通过添加由随机森林算法标记的408个伪标签HNCa病例(共199个LCa病例),扩展了数据集,使用相同的HMLS技术。 此外, 主成分分析(PCA)结合4个生存预测算法用于生存风险比分析。 结果:SSL策略优于SL方法(p值<0.05),使用PET的DRF和PCA+多层感知机(MLP)实现了平均准确率0.85,而SL策略使用CT的DRF和PCA+K最近邻(KNN)则为0.65。 此外, PCA结合从CT提取的HRF和DRF上的分量梯度提升生存分析,具有平均c指数0.80,Log Rank p值<<0.001,外部测试确认。 结论:从HRF和SL转向DRF和SSL策略,特别是在数据点有限的情况下,使单独的CT或PET能够显著实现高预测性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.