计算机科学 > 机器学习
[提交于 2025年7月1日
]
标题: 三种人工智能模型(NLP、LLM、JEPA)在急诊科分诊预测中的开发与比较评估:一项7个月的回顾性概念验证
标题: Development and Comparative Evaluation of Three Artificial Intelligence Models (NLP, LLM, JEPA) for Predicting Triage in Emergency Departments: A 7-Month Retrospective Proof-of-Concept
摘要: 分诊错误,包括分诊不足和过度分诊,是急诊科(EDs)持续存在的挑战。 随着患者数量的增加和人员短缺,将人工智能(AI)整合到分诊协议中引起了关注。 本研究比较了三种AI模型[自然语言处理(NLP)、大语言模型(LLM)和联合嵌入预测架构(JEPA)]在预测分诊结果方面与FRENCH量表和临床实践的性能。我们对一个前瞻性招募的队列进行了回顾性分析,该队列收集了罗杰·萨伦格罗医院急诊科(法国里尔)7个月内的成年患者分诊数据。 三个AI模型进行了训练和验证:(1)TRIAGEMASTER(NLP),(2)URGENTIAPARSE(LLM),以及(3)EMERGINET(JEPA)。 数据包括人口统计信息、原始主诉、生命体征以及基于FRENCH量表和GEMSA编码的分诊结果。 主要结果是AI预测的分诊级别与FRENCH黄金标准的一致性。 通过各种指标进行评估:F1分数、加权Kappa、斯皮尔曼、MAE、RMSE。 LLM模型(URGENTIAPARSE)的准确性更高(综合得分:2.514),相比JEPA(EMERGINET,0.438)和NLP(TRIAGEMASTER,-3.511),优于护士分诊(-4.343)。 次要分析突显了URGENTIAPARSE在预测住院需求(GEMSA)方面的有效性及其在结构化数据与原始转录文本之间的稳健性(无论是用于GEMSA预测还是FRENCH预测)。 通过患者表示的抽象,LLM架构在测试模型中提供了最准确的分诊预测。 将AI整合到急诊科工作流程中可以提高患者安全性和运营效率,尽管将AI整合到临床工作流程中需要解决模型限制并确保伦理透明度。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.