物理学 > 医学物理
[提交于 2025年1月4日
]
标题: 探索大型语言模型在放射肿瘤学决策支持中的能力与局限性
标题: Exploring the Capabilities and Limitations of Large Language Models for Radiation Oncology Decision Support
摘要: 由于大型语言模型(LLMs)在决策支持工具中的快速整合,大规模系统正在经历重大变革。 与其他医学领域一样,GPT-4等大型语言模型在放射肿瘤学中的应用也日益受到关注。 通过一项专门针对放射肿瘤学物理这一高度专业主题的100道题考试,尝试评估GPT-4的表现,结果显示GPT-4优于其他大型语言模型。 GPT-4在更广泛的临床放射肿瘤学领域的表现也通过美国放射学会(ACR)的放射肿瘤学住院医师培训(TXIT)考试进行了基准测试,GPT-4取得了74.57%的高准确率。 其根据AAPM TG-263报告重新标记结构名称的表现也进行了基准测试,准确率超过96%。 这些研究揭示了大型语言模型在放射肿瘤学中的潜力。 随着对大型语言模型在一般医疗应用中的潜力和限制的兴趣持续上升5,大型语言模型在放射肿瘤学决策支持中的能力和局限性尚未得到充分探索。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.