统计学 > 应用
[提交于 2019年11月19日
]
标题: 检查电子健康记录的数据质量和完整性对预测患者心血管疾病风险的影响
标题: Examining the impact of data quality and completeness of electronic health records on predictions of patients risks of cardiovascular disease
摘要: 目标是评估电子健康记录的数据质量和完整性变化程度以及其对基于常规收集数据的风险预测工具(QRISK3)预测新发心血管疾病(CVD)风险的稳健性的影响。 研究设计是一项纵向队列研究,设置为392个全科诊所(包括360万名患者)并与医院住院数据相链接。 使用Saez稳定性指标评估数据质量的变化,这些指标量化了每个诊所的异常程度。 统计脆弱性模型评估了QRISK3在个体预测和整体风险因素(线性预测器)效应上的准确性是否在不同诊所之间存在差异。 在未被QRISK3解释的CVD发生率方面,各诊所之间存在显著异质性。 在统计脆弱性最低的五分位数中,将女性的QRISK3预测风险设为10%时,考虑到诊所变异性后,该风险范围在7.1%至9.0%之间;在最高的五分位数中,该范围为10.9%至16.4%。 数据质量(使用Saez指标)和完整性在不同统计脆弱性水平之间是相当的。 例如,对于从最低到最高统计脆弱性五分位数的诊所,种族信息缺失记录的比例分别为55.7%、62.7%、57.8%、64.8%和62.1%。 风险因素的影响在不同诊所之间没有显著变化,β系数的统计变异很小。 结论是,各诊所之间CVD发生率的显著未测量异质性并未被数据质量的变化或风险因素的影响所解释。 应结合临床判断和额外风险因素的证据来补充QRISK3的风险预测。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.