Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.14062

帮助 | 高级搜索

计算机科学 > 数据结构与算法

arXiv:2506.14062 (cs)
[提交于 2025年6月18日 ]

标题: 一个精确且高效的动态离散分布采样器

标题: An Exact and Efficient Sampler for Dynamic Discrete Distributions

Authors:Lilith Orion Hafner, Adriano Meligrana
摘要: 从动态离散分布中采样涉及从一组带权重的元素中采样,这些元素可以在采样过程的任意阶段被添加或移除。 尽管对于静态集合来说效率很高,但别名方法在动态环境中变得不切实际,因为每次更新后都需要重新构造采样器,这会导致计算成本与分布大小成正比,使其不适合需要频繁插入、删除或调整权重的应用场景。 为了解决这一局限性,研究了不同的方法,例如树森林方法和BUCKET采样(BUS)方法。 然而,所有先前的方法都存在数值问题,这些问题可能使采样过程产生偏差。 在本文中,我们描述了EBUS(精确BUCKET采样),这是第一个具有$O(1)$采样和更新成本的精确算法。 该采样器可以通过具有有界精度和指数的基底$b$数字进行更新,并且可以精确且高效地采样其元素的分布。 我们还提供了使用IEEE 64位浮点数对该方法的最先进的实现,并通过实证表明它比先前的几种不精确方法的实现更有效。
摘要: Sampling from a dynamic discrete distribution involves sampling from a dynamic set of weighted elements, where elements can be added or removed at any stage of the sampling process. Although efficient for static sets, the Alias method becomes impractical in dynamic settings due to the need to reconstruct the sampler after each update, which incurs a computational cost proportional to the size of the distribution, making it unsuitable for applications requiring frequent insertions, deletions, or weight adjustments. To address this limitation, different approaches have been studied, such as the Forest of Trees method and the BUcket Sampling (BUS) method. However, all previous methods suffered from numerical issues which can bias the sampling process. In this paper, we describe EBUS (Exact BUcket Sampling), the first exact algorithm with $O(1)$ sampling and update cost. The sampler can be updated by base-$b$ numbers with bounded precision and exponent, and sample the distribution of its elements exactly and efficiently. We provide also a state of the art implementation of the method using IEEE 64-bit floating point numbers which we empirically show to be more efficient than several implementations of previous inexact methods.
评论: 8页,5个图
主题: 数据结构与算法 (cs.DS) ; 概率 (math.PR); 计算 (stat.CO)
引用方式: arXiv:2506.14062 [cs.DS]
  (或者 arXiv:2506.14062v1 [cs.DS] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.14062
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Adriano Meligrana [查看电子邮件]
[v1] 星期三, 2025 年 6 月 18 日 00:12:51 UTC (137 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.DS
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
math
math.PR
stat
stat.CO

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号