统计学 > 方法论
[提交于 2016年2月1日
]
标题: 高维非参数回归的谱系列方法
标题: A Spectral Series Approach to High-Dimensional Nonparametric Regression
摘要: 现代统计学中的一个重要问题是,如何对复杂、高维的数据进行快速且可靠的推断。尽管稀疏技术受到了广泛关注,但目前的方法在处理具有非线性结构的数据时泛化能力较差。在这项工作中,我们提出了一种正交级数估计器,用于复杂的复合预测变量(如自然图像、星系光谱、轨迹和电影)。 我们的级数方法结合了核机器学习和傅里叶方法的思想。我们将未知回归函数在数据上用基于核算子的特征函数展开,并利用基底相对于潜在数据分布P的正交性来加速计算和参数调整。如果核选择得当,那么特征函数可以自适应于数据的内在几何结构和维度。对于具有变化带宽的径向核,我们提供了理论保证,并将回归函数相对于P的光滑性与特征基的稀疏性联系起来。 最后,使用模拟数据和真实数据,我们系统地比较了频谱级数方法与经典核平滑、k-最近邻回归、核岭回归以及最先进的流形和局部回归方法的性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.