文章主要内容总结
本文旨在比较三种人工智能(AI)模型——自然语言处理(NLP)、大型语言模型(LLM)和联合嵌入预测架构(JEPA)在急诊科(ED)分诊预测中的表现。研究以法国里尔Roger Salengro医院急诊科7个月的成人患者分诊数据为基础,回顾性分析了657例符合条件的患者数据,训练并验证了三个模型:TRIAGEMASTER(NLP)、URGENTIAPARSE(LLM)和EMERGINET(JEPA)。
研究以法国FRENCH分诊量表为金标准,通过F1分数、加权Kappa系数、Spearman相关系数、MAE、RMSE等指标评估模型预测一致性,并分析模型对住院需求(GEMSA编码)的预测能力及不同数据类型(结构化数据vs原始转录文本)下的表现。
主要结果显示,LLM模型(URGENTIAPARSE)综合得分最高(2.514),显著优于JEPA(0.438)、NLP(-3.511)及护士分诊(-4.343);其在预测住院需求(GEMSA)和处理结构化数据时表现更稳健。结论指出,LLM通过抽象患者表征实现了最准确的分诊预