数学 > 统计理论
[提交于 2007年11月7日
]
标题: 变量选择后回归中置信区间的最小覆盖概率的上界
标题: Upper bounds on the minimum coverage probability of confidence intervals in regression after variable selection
摘要: 我们考虑一个线性回归模型,感兴趣的参数是回归参数向量的指定线性组合。假设首先通过数据驱动的模型选择方法(例如,通过初步假设检验或最小化AIC)来选择模型。通常的统计实践是基于所选模型是先验给定的假设,构建感兴趣参数的置信区间。然而,这个假设是错误的,并可能导致置信区间具有较差的覆盖率性质。我们提供了一个易于计算的有限样本上界(通过重复数值评估双重积分计算得出),用于该置信区间的最低覆盖率概率。此上界适用于以下任意一种模型选择方法:最小AIC、最小BIC、最大调整R平方、最小Mallows' Cp和t检验。这一上界的重要意义在于它界定了设计矩阵和模型选择程序的一般类别,对于这些类别,该置信区间具有较差的覆盖率性质。此上界被证明是Kabaila和Leeb早期大样本上界的有限样本类比。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.