数学 > 统计理论
[提交于 2025年4月30日
(v1)
,最后修订 2025年5月22日 (此版本, v2)]
标题: 离散分布相对熵的估计及缺失质量偏差
标题: Estimation of discrete distributions in relative entropy, and the deviations of the missing mass
摘要: 我们研究了从独立同分布样本估计有限字母表上分布的问题,并以相对熵(Kullback-Leibler散度)来衡量精度。尽管已知最优的期望风险界,高概率保证仍然较少为人所理解。首先,我们分析了经典的拉普拉斯(加一)估计器,得到了其性能的匹配上下界,并证明了它在无信心依赖估计器中的最优性。然后,我们刻画了最小最大高概率风险,通过简单的信心依赖平滑技术实现。有趣的是,最优的非渐近风险在理想渐近风险之上表现出额外的对数因子。接下来,受字母表超过样本量场景的启发,我们研究了适应分布稀疏性的方法。我们引入了一种使用数据依赖平滑的估计器,并建立了依赖于两个有效稀疏参数的高概率风险界。作为分析的一部分,我们还推导出了缺失质量的尖锐高概率上界。
当前浏览上下文:
math.ST
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.