数学 > 统计理论
[提交于 2025年4月30日
(此版本)
, 最新版本 2025年5月22日 (v2)
]
标题: 离散分布相对熵的估计及缺失质量偏差
标题: Estimation of discrete distributions in relative entropy, and the deviations of the missing mass
摘要: 我们研究了从独立同分布样本中估计有限字母表上分布的问题,精度通过相对熵(Kullback-Leibler散度)来衡量。虽然预期风险的最优界已经知道,但概率较高的保证仍然理解得不够充分。首先,我们分析了经典的拉普拉斯(加-$1$)估计器,得到了关于其性能的匹配的上下界,并证明了它在无信心独立估计器中的最优性。然后,我们刻画了任何估计器能达到的最小最大概率较高风险,这可以通过简单的置信依赖平滑技术实现。有趣的是,非渐近最优风险比理想的渐近风险多了一个对数因子。接下来,受字母表超过样本量场景的启发,我们研究了适应于手头分布稀疏性的方法。我们引入了一种使用数据依赖平滑的估计器,并建立了与两个有效稀疏参数相关的概率较高风险界。作为分析的一部分,我们还推导出了缺失质量的概率较高上界。
当前浏览上下文:
math.ST
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.