统计学 > 方法论
[提交于 2018年10月11日
]
标题: 二元结果预测规则的构建与评估:在存在缺失预测变量数据的情况下使用多重插补方法:理论视角与基于数据的评估
标题: Construction and assessment of prediction rules for binary outcome in the presence of missing predictor data using multiple imputation: theoretical perspective and data-based evaluation
摘要: 我们研究在预测变量存在缺失值时,预后设计中预测规则的校准和评估问题。 我们的论文有两个关键目标,这两个目标是紧密交织在一起的。 第一个目标是研究如何将预测规则的校准与多重插补方法结合,以处理缺失的预测变量观测值。 第二个目标是提出可以使用当前多重插补软件实现的方法,同时允许通过在结果尚未可用的新观测值上进行验证来进行无偏预测评估。 为了明确方法论的定义,我们首先回顾多重插补作为模型估计方法的理论背景,而不是纯粹的算法描述。 我们特别对比了多重插补在参数(效应)估计中的应用与预测校准的应用。 基于这一回顾,形成了两种方法,其中第二种方法利用经典的Rubin规则进行参数估计,而第一种方法通过对单次插补拟合的模型计算概率,直接近似未来观测值的预测密度。 我们展示了使用当前软件的实现方式,这些软件允许对性能指标进行验证或交叉验证估计,以及在结果尚未观察到的未来数据中对预测变量的缺失数据进行插补。 我们始终限制讨论为二元结果和逻辑回归,尽管所讨论的原则通常适用。 我们提供了两个数据集作为我们常规咨询实践中的例子。 结果表明,对于准确性,不同方法之间的差异很小,但使用第一种方法时,校准概率的变异性有显著降低。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.