统计学 > 机器学习
[提交于 2019年2月14日
(v1)
,最后修订 2019年6月9日 (此版本, v2)]
标题: 具有未知类条件标签噪声的非紧致特征空间分类
标题: Classification with unknown class-conditional label noise on non-compact feature spaces
摘要: 我们研究在存在未知类别条件标签噪声的情况下分类问题,其中学习者观察到的标签已被某些未知的类别依赖概率所污染。 为了获得有限样本率,以往针对未知类别条件标签噪声的分类方法要求回归函数在其极大值集上接近其极值。 我们将在这个非紧致度量空间的设置中考虑这个问题,在这种情况下,回归函数不必达到其极值。 在这种设置下,我们确定了最小最大最优学习率(忽略对数因子)。 该速率表现出有趣的阈值行为:当回归函数以足够的速度接近其极值时,最优学习率与无标签噪声情况下的速率处于同一阶。 如果回归函数更缓慢地接近其极值,则分类性能必然下降。 此外,我们提出了一种自适应算法,无需事先了解分布参数或局部密度即可达到这些速率。 这是首次识别出一种在标签噪声设置中可实现有限样本率的情况,但其速率与无标签噪声时的最优速率不同。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.