统计学 > 方法论
[提交于 2025年7月21日
]
标题: 鲁棒且差分隐私的PCA用于非高斯数据
标题: Robust and Differentially Private PCA for non-Gaussian data
摘要: 最近的进展激发了对隐私保护主成分分析(PCA)发展的广泛关注。 然而,许多现有方法依赖于限制性假设,例如假设数据服从次高斯分布或容易受到数据污染的影响。 此外,一些方法计算成本高昂,或者依赖于必须估计的未知模型参数,这限制了寻求隐私保护PCA的数据分析师的使用。 在本文中,我们提出了一种适用于重尾和可能受污染数据的差分隐私PCA方法。 我们的方法利用了适当缩放数据的协方差矩阵在椭圆分布下保留特征向量及其顺序的性质,这些分布包括高斯分布和重尾分布。 通过应用有界变换,我们能够在差分隐私的情况下直接计算主成分。 此外,有界性保证了对数据污染的鲁棒性。 我们对所提出的方法进行了理论分析和实证评估,重点是其恢复由前导主成分张成子空间的能力。 广泛的数值实验表明,与现有方法相比,我们的方法在统计效用方面表现一致更好,特别是在非高斯或受污染的数据设置中。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.