计算机科学 > 计算与语言
[提交于 2024年12月31日
]
标题: GPT-4在临床抑郁症评估中的应用:一项基于大模型的试点研究
标题: GPT-4 on Clinic Depression Assessment: An LLM-Based Pilot Study
摘要: 抑郁症已影响了全球数百万人,并已成为最普遍的心理障碍之一。 早期心理障碍检测可以为公共卫生机构节省成本,并避免其他主要共病的发生。 此外,专业人员的短缺是一个关键问题,因为临床抑郁症诊断高度依赖专家并耗时。 在本研究中,我们探讨基于转录分析使用GPT-4进行临床抑郁症评估的可行性。 我们检查模型将患者访谈分类为二元类别(抑郁和非抑郁)的能力。 进行比较分析时考虑提示复杂性(例如,使用简单和复杂的提示)以及不同的温度设置,以评估提示复杂性和随机性对模型性能的影响。 结果表明,GPT-4在不同配置下的准确性和F1分数表现出较大的变化,对于复杂提示,在较低温度值(0.0-0.2)时表现出最佳性能。 然而,超过一定阈值(温度>=0.3)后,随机性和性能之间的关系变得不可预测,降低了提示复杂性的收益。 这些发现表明,尽管GPT-4在临床评估方面显示出潜力,但提示和模型参数的配置需要仔细校准以确保结果的一致性。 这项初步研究有助于理解提示工程与大型语言模型之间的动态关系,为未来在临床环境中开发人工智能工具提供了见解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.