Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.01080

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2507.01080 (cs)
[提交于 2025年7月1日 ]

标题: 三种人工智能模型(NLP、LLM、JEPA)在急诊科分诊预测中的开发与比较评估:一项7个月的回顾性概念验证

标题: Development and Comparative Evaluation of Three Artificial Intelligence Models (NLP, LLM, JEPA) for Predicting Triage in Emergency Departments: A 7-Month Retrospective Proof-of-Concept

Authors:Edouard Lansiaux, Ramy Azzouz, Emmanuel Chazard, Amélie Vromant, Eric Wiel
摘要: 分诊错误,包括分诊不足和过度分诊,是急诊科(EDs)持续存在的挑战。 随着患者数量的增加和人员短缺,将人工智能(AI)整合到分诊协议中引起了关注。 本研究比较了三种AI模型[自然语言处理(NLP)、大语言模型(LLM)和联合嵌入预测架构(JEPA)]在预测分诊结果方面与FRENCH量表和临床实践的性能。我们对一个前瞻性招募的队列进行了回顾性分析,该队列收集了罗杰·萨伦格罗医院急诊科(法国里尔)7个月内的成年患者分诊数据。 三个AI模型进行了训练和验证:(1)TRIAGEMASTER(NLP),(2)URGENTIAPARSE(LLM),以及(3)EMERGINET(JEPA)。 数据包括人口统计信息、原始主诉、生命体征以及基于FRENCH量表和GEMSA编码的分诊结果。 主要结果是AI预测的分诊级别与FRENCH黄金标准的一致性。 通过各种指标进行评估:F1分数、加权Kappa、斯皮尔曼、MAE、RMSE。 LLM模型(URGENTIAPARSE)的准确性更高(综合得分:2.514),相比JEPA(EMERGINET,0.438)和NLP(TRIAGEMASTER,-3.511),优于护士分诊(-4.343)。 次要分析突显了URGENTIAPARSE在预测住院需求(GEMSA)方面的有效性及其在结构化数据与原始转录文本之间的稳健性(无论是用于GEMSA预测还是FRENCH预测)。 通过患者表示的抽象,LLM架构在测试模型中提供了最准确的分诊预测。 将AI整合到急诊科工作流程中可以提高患者安全性和运营效率,尽管将AI整合到临床工作流程中需要解决模型限制并确保伦理透明度。
摘要: Triage errors, including undertriage and overtriage, are persistent challenges in emergency departments (EDs). With increasing patient influx and staff shortages, the integration of artificial intelligence (AI) into triage protocols has gained attention. This study compares the performance of three AI models [Natural Language Processing (NLP), Large Language Models (LLM), and Joint Embedding Predictive Architecture (JEPA)] in predicting triage outcomes against the FRENCH scale and clinical practice.We conducted a retrospective analysis of a prospectively recruited cohort gathering adult patient triage data over a 7-month period at the Roger Salengro Hospital ED (Lille, France). Three AI models were trained and validated : (1) TRIAGEMASTER (NLP), (2) URGENTIAPARSE (LLM), and (3) EMERGINET (JEPA). Data included demographic details, verbatim chief complaints, vital signs, and triage outcomes based on the FRENCH scale and GEMSA coding. The primary outcome was the concordance of AI-predicted triage level with the FRENCH gold-standard. It was assessed thanks to various indicators : F1-Score, Weighted Kappa, Spearman, MAE, RMSE. The LLM model (URGENTIAPARSE) showed higher accuracy (composite score: 2.514) compared to JEPA (EMERGINET, 0.438) and NLP (TRIAGEMASTER, -3.511), outperforming nurse triage (-4.343). Secondary analyses highlighted the effectiveness of URGENTIAPARSE in predicting hospitalization needs (GEMSA) and its robustness with structured data versus raw transcripts (either for GEMSA prediction or for FRENCH prediction). LLM architecture, through abstraction of patient representations, offers the most accurate triage predictions among tested models. Integrating AI into ED workflows could enhance patient safety and operational efficiency, though integration into clinical workflows requires addressing model limitations and ensuring ethical transparency.
评论: 15页,6图
主题: 机器学习 (cs.LG) ; 性能 (cs.PF)
引用方式: arXiv:2507.01080 [cs.LG]
  (或者 arXiv:2507.01080v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.01080
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Edouard Lansiaux [查看电子邮件]
[v1] 星期二, 2025 年 7 月 1 日 16:37:55 UTC (1,021 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.PF

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号