统计学 > 机器学习
[提交于 2024年2月1日
]
标题: 光谱变换核回归
标题: Spectrally Transformed Kernel Regression
摘要: 未标记数据是现代机器学习中的关键组成部分。一般来说,未标记数据的作用是施加一种平滑性,通常是从基础核函数中编码的相似性信息中获取的,例如 \$\epsilon$-邻域核或图的邻接矩阵。本文重新审视了光谱变换核回归(STKR)的经典思想,并提供了一类新的通用且可扩展的STKR估计器,能够利用未标记的数据。直观上,通过光谱变换,STKR利用了未标记数据可以提供额外信息的数据分布。首先,我们展示了STKR是一种原则性强且通用的方法,通过刻画一种“目标平滑性”的普适类型,并证明了任何足够平滑的函数都可以被STKR学习到。其次,我们为归纳设置和一般变换函数提供了可扩展的STKR实现,而先前的工作大多局限于传递设置。第三,我们为两种情况推导了统计保证:已知多项式变换的STKR以及未知变换时使用核主成分分析(PCA)的STKR。总体而言,我们认为这项工作有助于加深我们对如何处理未标记数据的理解,其通用性使得它更容易启发新方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.