物理学 > 医学物理
[提交于 2025年1月27日
]
标题: 评估使用大型语言模型在放射肿瘤学中自动化计算机断层扫描模拟订单摘要的性能
标题: Evaluating The Performance of Using Large Language Models to Automate Summarization of CT Simulation Orders in Radiation Oncology
摘要: 目的:本研究旨在使用大型语言模型(LLM)自动化生成来自CT模拟订单的摘要,并评估其性能。 材料和方法:从我们机构的Aria数据库中收集了607份患者的CT模拟订单。 使用本地托管的Llama 3.1 405B模型,通过应用程序编程接口(API)服务访问,用于从CT模拟订单中提取关键词并生成摘要。 下载的CT模拟订单根据治疗方式和疾病部位分为七个组。 对于每组,与治疗师合作开发了定制的指令提示,以指导Llama 3.1 405B模型生成摘要。 相应摘要的基准真实数据是通过仔细审查每份CT模拟订单手动得出的,随后由治疗师进行验证。 治疗师使用经过验证的基准真实数据作为参考,评估LLM生成的摘要的准确性。 结果:大约98%的LLM生成的摘要在准确性方面与手动生成的基准真实数据一致。 我们的评估显示,与相应的治疗师生成的摘要相比,LLM生成的摘要在格式上更加一致,可读性更强。 这种自动化方法在所有组中均表现出一致的性能,无论治疗方式或疾病部位如何。 结论:本研究展示了Llama 3.1 405B模型在提取关键词和总结CT模拟订单方面的高精度和一致性,表明LLM在该任务中具有巨大潜力,可以减轻治疗师的工作负担并提高工作效率。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.