计算机科学 > 数据结构与算法
            [提交于 2025年6月18日
            
            
            
            ]
          
          标题: 一个精确且高效的动态离散分布采样器
标题: An Exact and Efficient Sampler for Dynamic Discrete Distributions
摘要: 从动态离散分布中采样涉及从一组带权重的元素中采样,这些元素可以在采样过程的任意阶段被添加或移除。 尽管对于静态集合来说效率很高,但别名方法在动态环境中变得不切实际,因为每次更新后都需要重新构造采样器,这会导致计算成本与分布大小成正比,使其不适合需要频繁插入、删除或调整权重的应用场景。 为了解决这一局限性,研究了不同的方法,例如树森林方法和BUCKET采样(BUS)方法。 然而,所有先前的方法都存在数值问题,这些问题可能使采样过程产生偏差。 在本文中,我们描述了EBUS(精确BUCKET采样),这是第一个具有$O(1)$采样和更新成本的精确算法。 该采样器可以通过具有有界精度和指数的基底$b$数字进行更新,并且可以精确且高效地采样其元素的分布。 我们还提供了使用IEEE 64位浮点数对该方法的最先进的实现,并通过实证表明它比先前的几种不精确方法的实现更有效。
文献和引用工具
与本文相关的代码,数据和媒体
            alphaXiv (什么是 alphaXiv?)
          
        
            CatalyzeX 代码查找器 (什么是 CatalyzeX?)
          
        
            DagsHub (什么是 DagsHub?)
          
        
            Gotit.pub (什么是 GotitPub?)
          
        
            Hugging Face (什么是 Huggingface?)
          
        
            带有代码的论文 (什么是带有代码的论文?)
          
        
            ScienceCast (什么是 ScienceCast?)
          
        演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.