Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:1911.08504

帮助 | 高级搜索

统计学 > 应用

arXiv:1911.08504 (stat)
[提交于 2019年11月19日 ]

标题: 检查电子健康记录的数据质量和完整性对预测患者心血管疾病风险的影响

标题: Examining the impact of data quality and completeness of electronic health records on predictions of patients risks of cardiovascular disease

Authors:Yan Li, Matthew Sperrin, Glen P. Martin, Darren M Ashcroft, Tjeerd Pieter van Staa
摘要: 目标是评估电子健康记录的数据质量和完整性变化程度以及其对基于常规收集数据的风险预测工具(QRISK3)预测新发心血管疾病(CVD)风险的稳健性的影响。 研究设计是一项纵向队列研究,设置为392个全科诊所(包括360万名患者)并与医院住院数据相链接。 使用Saez稳定性指标评估数据质量的变化,这些指标量化了每个诊所的异常程度。 统计脆弱性模型评估了QRISK3在个体预测和整体风险因素(线性预测器)效应上的准确性是否在不同诊所之间存在差异。 在未被QRISK3解释的CVD发生率方面,各诊所之间存在显著异质性。 在统计脆弱性最低的五分位数中,将女性的QRISK3预测风险设为10%时,考虑到诊所变异性后,该风险范围在7.1%至9.0%之间;在最高的五分位数中,该范围为10.9%至16.4%。 数据质量(使用Saez指标)和完整性在不同统计脆弱性水平之间是相当的。 例如,对于从最低到最高统计脆弱性五分位数的诊所,种族信息缺失记录的比例分别为55.7%、62.7%、57.8%、64.8%和62.1%。 风险因素的影响在不同诊所之间没有显著变化,β系数的统计变异很小。 结论是,各诊所之间CVD发生率的显著未测量异质性并未被数据质量的变化或风险因素的影响所解释。 应结合临床判断和额外风险因素的证据来补充QRISK3的风险预测。
摘要: The objective is to assess the extent of variation of data quality and completeness of electronic health records and impact on the robustness of risk predictions of incident cardiovascular disease (CVD) using a risk prediction tool that is based on routinely collected data (QRISK3). The study design is a longitudinal cohort study with a setting of 392 general practices (including 3.6 million patients) linked to hospital admission data. Variation in data quality was assessed using Saez stability metrics quantifying outlyingness of each practice. Statistical frailty models evaluated whether accuracy of QRISK3 predictions on individual predictions and effects of overall risk factors (linear predictor) varied between practices. There was substantial heterogeneity between practices in CVD incidence unaccounted for by QRISK3. In the lowest quintile of statistical frailty, a QRISK3 predicted risk of 10% for female was in a range between 7.1% and 9.0% when incorporating practice variability into the statistical frailty models; for the highest quintile, this was 10.9%-16.4%. Data quality (using Saez metrics) and completeness were comparable across different levels of statistical frailty. For example, recording of missing information on ethnicity was 55.7%, 62.7%, 57.8%, 64.8% and 62.1% for practices from lowest to highest quintiles of statistical frailty respectively. The effects of risk factors did not vary between practices with little statistical variation of beta coefficients. In conclusion, the considerable unmeasured heterogeneity in CVD incidence between practices was not explained by variations in data quality or effects of risk factors. QRISK3 risk prediction should be supplemented with clinical judgement and evidence of additional risk factors.
评论: 2张表格4张图表在主文稿中,1张表格3张图表在附录中。在线发表于IJMI,许可证为CC-BY-NC-ND
主题: 应用 (stat.AP) ; 方法论 (stat.ME)
MSC 类: 62N01
引用方式: arXiv:1911.08504 [stat.AP]
  (或者 arXiv:1911.08504v1 [stat.AP] 对于此版本)
  https://doi.org/10.48550/arXiv.1911.08504
通过 DataCite 发表的 arXiv DOI
期刊参考: https://doi.org/10.1016/j.ijmedinf.2019.104033
相关 DOI: https://doi.org/10.1016/j.ijmedinf.2019.104033
链接到相关资源的 DOI

提交历史

来自: Yan Li [查看电子邮件]
[v1] 星期二, 2019 年 11 月 19 日 19:02:44 UTC (3,134 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
查看许可
当前浏览上下文:
stat.AP
< 上一篇   |   下一篇 >
新的 | 最近的 | 2019-11
切换浏览方式为:
stat
stat.ME

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号