计算机科学 > 数据结构与算法
[提交于 2023年5月4日
(v1)
,最后修订 2024年11月21日 (此版本, v2)]
标题: 测试凸截断
标题: Testing Convex Truncation
摘要: 我们研究了测试正态分布的$n$维数据是否被截断的基本统计问题,即通过仅保留位于某个未知截断集$S \subseteq \mathbb{R}^n$中的点来改变数据。作为我们的主要算法结果, (1) 我们给出一个计算高效的$O(n)$样本算法,该算法可以区分标准正态分布$N(0,I_n)$与在某个未知且任意的凸集$S$条件下的分布$N(0,I_n)$。 (2) 我们给出一种不同的计算高效的$O(n)$-样本算法,该算法可以在未知且任意的对称凸集混合条件下区分$N(0,I_n)$与$N(0,I_n)$。 这些结果与在正态分布下学习或测试凸体或学习凸截断正态分布的已知结果形成鲜明对比,其中最先进的算法本质上需要$n^{\sqrt{n}}$个样本。 一个简单的论证表明,没有有限数量的样本足以区分$N(0,I_n)$与未知且任意的一般(不一定对称)凸集的混合,因此无法对上述结果(1)和(2)进行共同的推广。 我们还证明,任何算法(无论计算上是否高效)在未知对称凸集的条件下,若能区分$N(0,I_n)$和$N(0,I_n)$,则必须使用$\Omega(n)$个样本。 这表明我们每个算法的样本复杂度至多相差一个常数因子是最佳的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.