数学 > 统计理论
[提交于 2010年3月11日
]
标题: 回归后初步F检验的置信区间覆盖率概率
标题: The coverage probabililty of confidence intervals in regression after a preliminary F test
摘要: 考虑一个线性回归模型,回归参数为beta=(beta_1,..., beta_p),独立正态误差。 假设感兴趣的参数是theta = a^T beta,其中a是给定的。 定义s维参数向量tau = C^T beta - t,其中C和t是给定的。 假设我们进行一个初步的F检验,检验原假设H_0: tau = 0与备择假设H_1: tau不等于0。 通常的统计实践是然后构造一个名义覆盖概率为1-alpha的theta的置信区间,使用相同的数据,基于所选模型已经被事先给出(作为真实模型)的假设。 我们将这称为theta的naive 1-alpha置信区间。 这个假设是错误的,可能导致这个置信区间的最小覆盖概率远低于1-alpha,使其完全不适用。 我们的目标是计算这个最小覆盖概率。 很容易找到这个置信区间的覆盖概率的表达式,这是一个s+1维的多重积分。 然而,我们推导出一个新的优雅且计算方便的公式来表示这个覆盖概率。 对于s=2,这个公式是一个三重积分和一个双重积分的和,而对于所有s>2,这个公式是一个四重积分和一个双重积分的和。 这使得无论s有多大,计算naive置信区间的最小覆盖概率变得容易。 这个公式的一个非常重要的实际应用是协方差分析。 在此背景下,可以定义tau使得H_0表达了"平行性"的假设。 应用统计学家通常建议进行这个假设的初步F检验。 我们通过一个实际的协方差数据分析集和一个"平行性"的初步F检验来说明我们公式的应用。 我们表明,naive 0.95置信区间具有最小覆盖概率0.0846,这表明它是完全不适用的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.