计算机科学 > 人工智能
[提交于 2024年6月10日
]
标题: 迈向个人健康大型语言模型
标题: Towards a Personal Health Large Language Model
摘要: 在健康领域,大多数大型语言模型(LLM)的研究集中在临床任务上。然而,移动设备和可穿戴设备很少被整合到这些任务中,它们为个人健康监测提供了丰富的纵向数据。在这里,我们介绍了个性化健康大型语言模型(PH-LLM),该模型基于Gemini进行微调,以理解和推理数值时间序列的个人健康数据。我们创建并整理了三个数据集,用于测试1)从睡眠模式、身体活动和生理反应中生成个性化见解和建议,2)专家领域知识,以及3)预测自我报告的睡眠结果。对于第一个任务,我们与领域专家合作设计了857个案例研究,以评估睡眠和健身中的现实场景。通过全面评估领域特定的评分标准,我们观察到Gemini Ultra 1.0和PH-LLM在健身方面与专家表现没有统计学差异,而专家在睡眠方面仍然占优,但对PH-LLM进行微调显著提高了使用相关领域知识和为睡眠见解个性化信息的能力。我们使用多项选择睡眠医学和健身考试评估了PH-LLM的领域知识。PH-LLM在睡眠方面得分为79%,在健身方面得分为88%,超过了人类专家样本的平均分数。最后,我们训练PH-LLM从可穿戴数据的文本和多模态编码表示中预测自我报告的睡眠质量结果,并证明多模态编码是匹配专用判别模型性能所必需的。尽管在安全关键的个人健康领域需要进一步的发展和评估,但这些结果展示了Gemini模型的广泛知识和能力,以及像PH-LLM所做的那样将生理数据情境化对于个人健康应用的好处。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.