统计学 > 机器学习
[提交于 2025年7月16日
]
标题: 在数据共享下选择更好的老虎机算法:A/B测试何时有效?
标题: Choosing the Better Bandit Algorithm under Data Sharing: When Do A/B Experiments Work?
摘要: 我们研究设计用于比较两种推荐算法性能的A/B实验。 先前的研究表明,由于实验单元之间存在一种特定形式的干扰,标准的均值差异估计器在估计全局处理效应(GTE)时存在偏差。 具体来说,处于处理和对照算法下的单元会贡献到一个共享的数据池,该数据池随后用于训练两种算法,从而导致两组之间的干扰。 这种数据共享引起的偏差被称为“共生偏差”。 在本文中,我们强调,在决策过程中,选择更好的算法时,GTE的符号通常比其精确大小更重要。 我们在多臂老虎机框架下正式阐述了这一见解,并理论分析了在数据共享下预期GTE估计的符号何时与真实GTE的符号一致或矛盾。 我们的分析确定了探索与利用的水平是决定共生偏差如何影响算法选择的关键因素。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.