数学 > 统计理论
[提交于 2010年9月14日
(此版本)
, 最新版本 2011年3月14日 (v2)
]
标题: Pac-bayesian 界限用于稀疏回归估计的指数权重
标题: Pac-bayesian bounds for sparse regression estimation with exponential weights
摘要: 我们考虑稀疏回归模型,其中参数的数量$p$大于样本量$n$。 在考虑高维问题时,困难在于提出能够在统计性能和计算性能之间取得良好平衡的估计量。 例如,BIC 估计量从统计角度来看表现良好\cite{BTW07},但只能计算$p$的值最多为几十的情况。 Lasso 估计量是凸优化问题的解,因此可以计算较大的$p$值。 然而,为了建立该估计量的快速收敛速率,需要对设计施加严格的条件。 Dalalyan 和 Tsybakov\cite{arnak}提出了一种方法,在问题的统计方面和计算方面取得了良好的平衡。 他们的估计量可以计算相对较大的$p$并且在设计的弱假设下满足良好的统计性质。 然而,\cite{arnak}仅在经验超额风险方面提出了稀疏性 oracle 不等式。 在本文中,我们提出了一种类似于\cite{arnak}的聚合过程,但具有改进的统计性能。 我们的主要理论结果是针对一种指数权重估计器的真正超额风险的概率稀疏性 oracle 不等式。 我们还提出了一种 MCMC 方法来计算我们对于合理较大的$p$值的估计器。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.