数学 > 统计理论
[提交于 2008年1月18日
(v1)
,最后修订 2008年6月26日 (此版本, v3)]
标题: 分类的 p 值
标题: P-values for classification
摘要: 设 $(X,Y)$ 是一个随机变量,由一个观测到的特征向量$X\in \mathcal{X}$和一个未知联合分布的未观测类别标签$Y\in \{1,2,...,L\}$组成。此外,设$\mathcal{D}$为一个训练数据集,它由$n$个完全可观测的独立副本$(X,Y)$构成。 通常的分类程序提供点预测器(分类器) $\widehat{Y}(X,\mathcal{D})$的$Y$或估计$Y$在给定$X$条件下的分布。 为了量化分类$X$的确定性,我们提议为每个$\theta =1,2,...,L$构造一个p值$\pi_{\theta}(X,\mathcal{D})$来检验零假设$Y=\theta$,暂时将$Y$视为固定参数。 换句话说,点预测器$\widehat{Y}(X,\mathcal{D})$被替换为一个具有特定置信水平的$Y$预测区域。 我们认为(i)这种方法优于传统方法,以及(ii)任何合理的分类器都可以被修改以生成非参数p值。 我们讨论了诸如最优性、单次使用和多次使用的有效性,以及计算和图形方面的问题。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.