统计学 > 方法论
[提交于 2015年7月26日
(v1)
,最后修订 2017年2月9日 (此版本, v2)]
标题: 关于在贝叶斯逻辑回归中使用柯西先验分布的应用
标题: On the Use of Cauchy Prior Distributions for Bayesian Logistic Regression
摘要: 在逻辑回归中,当预测变量的线性组合可以完美分类样本中的部分或全部观测值时,就会发生分离现象,结果导致回归系数的最大似然估计有限不存在。Gelman等(2008)建议在逻辑回归中使用独立的柯西分布作为回归系数的默认先验分布,即使在分离的情况下也是如此,并在他们的分析中报告了后验众数。由于柯西先验的均值不存在,一个自然的问题是,在分离情况下,回归系数的后验均值是否存在。我们证明了定理,这些定理为在logit链接和包括probit链接在内的广义链接函数族下,独立柯西先验的后验均值的存在性提供了必要且充分的条件。我们还研究了多变量柯西先验下的后验均值的存在性。对于完整的贝叶斯推断,我们开发了一个基于Polya-Gamma数据增强的吉布斯采样器,用于从独立的学生t先验包括柯西先验下的后验分布中进行抽样,并在补充材料中提供了一个配套的R包。我们通过实证表明,即使在分离情况下回归系数的后验均值存在,柯西先验的后验样本的幅度可能异常大,相应的吉布斯采样器表现出极慢的混合速度。虽然像Stan中的No-U-Turn采样器这样的替代算法可以显著改善混合效果,但为了解决分离情况下柯西先验的极端重尾后验问题,需要考虑尾部较轻的先验,如正态先验或自由度大于1的学生t先验。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.