统计学 > 应用
[提交于 2025年6月10日
(v1)
,最后修订 2025年10月10日 (此版本, v2)]
标题: 结构化和间歇性缺失的电子健康记录综合分析
标题: Integrated Analysis for Electronic Health Records with Structured and Sporadic Missingness
摘要: 目标:我们提出了一种针对具有结构化和偶尔缺失性的电子健康记录(EHRs)的新型填补方法。这种缺失性在整合异构EHR数据集用于下游临床应用时经常出现。通过解决这些缺口,我们的方法为集成分析提供了实用的解决方案,提高了数据的实用性,并推动了对人群健康的理解。材料和方法:我们首先展示了在EHR数据分析集成中的结构化和偶尔缺失机制。随后,我们介绍了一个名为Macomss的新填补框架,专门设计用于处理结构化和异构发生的缺失数据。我们建立了Macomss的理论保证,确保其在保持集成分析的完整性和可靠性方面的稳健性。为了评估其经验性能,我们进行了广泛的模拟研究,复制了现实世界EHR系统中观察到的复杂缺失模式,并通过杜克大学健康系统(DUHS)的EHR数据集进行验证。结果:模拟研究表明,我们的方法在大多数情况下始终优于现有的填补方法。使用DUHS内三家医院的数据集,Macomss在大多数情况下实现了最低的填补误差,并且与基准方法相比,提供了更优或相当的下游预测性能。结论:我们提供了一种理论上保证且实际有意义的方法,用于填补结构化和偶尔缺失的数据,使多个EHR数据集的准确可靠集成分析成为可能。所提出的方法在推动人群健康研究方面具有重要意义。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.