定量生物学 > 组织与器官
[提交于 2025年1月20日
]
标题: 基于SEER数据库预测肝细胞癌的肺转移
标题: Prediction of Lung Metastasis from Hepatocellular Carcinoma using the SEER Database
摘要: 肝细胞癌(HCC)是导致癌症相关死亡的主要原因,肺转移是最常见的远端扩散部位,并显著恶化预后。 尽管临床和人口统计数据的可用性不断增加,但针对HCC肺转移的预测模型在范围和临床适用性方面仍有限。 在本研究中,我们使用来自监测、流行病学和最终结果(SEER)数据库的数据开发并验证了一个端到端的机器学习流程。 我们评估了三种机器学习模型(随机森林、XGBoost和逻辑回归)以及一个多层感知器(MLP)神经网络。 我们的模型实现了高AUROC值和召回率,其中随机森林和MLP模型表现出最佳的整体性能(AUROC = 0.82)。 然而,各模型的低精确度突显了准确预测阳性病例的挑战。 为解决这些限制,我们开发了一个自定义损失函数,结合召回优化,使MLP模型达到最高的灵敏度。 集成方法进一步通过利用单个模型的优势提高了整体召回率。 特征重要性分析揭示了关键预测因素,如手术状态、肿瘤分期和随访时间,强调了临床干预和疾病进展在转移预测中的相关性。 虽然本研究展示了机器学习在识别高风险患者方面的潜力,但局限性包括依赖于不平衡数据集、特征注释不完整以及预测的低精确度。 未来的工作应利用不断扩展的SEER数据集,改进数据填补技术,并探索先进的预训练模型以提高预测准确性和临床实用性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.