Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.01594

帮助 | 高级搜索

计算机科学 > 计算与语言

arXiv:2501.01594 (cs)
[提交于 2025年1月3日 ]

标题: PSYCHE:用于评估精神科评估对话代理的多方面患者模拟框架

标题: PSYCHE: A Multi-faceted Patient Simulation Framework for Evaluation of Psychiatric Assessment Conversational Agents

Authors:Jingoo Lee, Kyungho Lim, Young-Chul Jung, Byung-Hoon Kim
摘要: 最近大型语言模型(LLMs)的进展加速了能够生成类似人类响应的对话代理的发展。 由于精神科评估通常涉及精神科医生和患者之间的复杂对话互动,因此对开发旨在模拟精神科医生在临床评估中角色的基于LLM的精神科评估对话代理(PACAs)的兴趣正在增长。 然而,用于基准测试PACAs与患者互动的临床适当性的标准化方法仍然研究不足。 在此,我们提出PSYCHE,一个新颖的框架,旨在实现对PACAs的1)临床相关性、2)伦理安全性、3)成本效率和4)定量评估。 这是通过基于多方面精神科结构模拟精神科患者来实现的,该结构定义了模拟患者的资料、病史和行为,PACAs需要对其进行评估。 我们通过一项由10名认证精神科医生参与的研究验证了PSYCHE的有效性,并通过对模拟患者话语的深入分析来支持该研究。
摘要: Recent advances in large language models (LLMs) have accelerated the development of conversational agents capable of generating human-like responses. Since psychiatric assessments typically involve complex conversational interactions between psychiatrists and patients, there is growing interest in developing LLM-based psychiatric assessment conversational agents (PACAs) that aim to simulate the role of psychiatrists in clinical evaluations. However, standardized methods for benchmarking the clinical appropriateness of PACAs' interaction with patients still remain underexplored. Here, we propose PSYCHE, a novel framework designed to enable the 1) clinically relevant, 2) ethically safe, 3) cost-efficient, and 4) quantitative evaluation of PACAs. This is achieved by simulating psychiatric patients based on a multi-faceted psychiatric construct that defines the simulated patients' profiles, histories, and behaviors, which PACAs are expected to assess. We validate the effectiveness of PSYCHE through a study with 10 board-certified psychiatrists, supported by an in-depth analysis of the simulated patient utterances.
评论: 前两位作者贡献相同
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI); 机器学习 (cs.LG)
引用方式: arXiv:2501.01594 [cs.CL]
  (或者 arXiv:2501.01594v1 [cs.CL] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.01594
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Byung-Hoon Kim M.D. Ph.D. [查看电子邮件]
[v1] 星期五, 2025 年 1 月 3 日 01:38:46 UTC (9,103 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
cs.CL
cs.LG

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号