数学 > 统计理论
[提交于 2016年2月22日
]
标题: 在相关性下的PCA中精确检测:所有特征值都重要
标题: Sharp detection in PCA under correlations: all eigenvalues matter
摘要: 主成分分析(PCA)是一种广泛用于降维的方法。 在高维数据中,对应于弱主成分(PCs)的“信号”特征值不一定与“噪声”特征值的总体分离。 因此,基于最大特征值的流行检验对检测弱PCs的效力有限。 在spiked模型的特殊情况下,某些与线性谱统计量(LSS)渐近等价的检验——对所有特征值进行平均效应——最近被证明可以实现一定的效力。 我们考虑了Marchenko和Pastur(1967)设定下的spiked模型的非参数、非高斯推广。 这允许噪声特征值的一般总体,即使在没有显著PCs的零假设下也能容纳相关变量。 我们在该模型中开发了基于LSS的新检验来检测弱PCs。 我们使用LSS的中心极限定理(CLT)证明最优的LSS满足第一类弗雷德霍姆积分方程。 我们开发了求解它的算法,基于我们最近计算极限经验谱的方法。 与标准的spiked模型不同,我们在“广泛分布”的零特征值分布下发现新检验具有很大的效力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.