计算机科学 > 机器学习
[提交于 2025年5月29日
]
标题: 最优臂识别与可能存在偏倚的离线数据
标题: Best Arm Identification with Possibly Biased Offline Data
摘要: 我们研究了固定置信度设置下具有潜在偏倚离线数据的最佳臂识别(BAI)问题,此类问题在现实世界场景中很常见,例如临床试验。 我们证明了在没有关于在线和离线分布之间偏倚界值的先验知识的情况下,自适应算法不可能实现。 为了解决这个问题,我们提出了LUCB-H算法,该算法通过引入辅助偏差校正来整合自适应置信边界,在LUCB框架内平衡离线和在线数据。 理论分析表明,当离线数据具有误导性时,LUCB-H的样本复杂度与标准LUCB相当;而当离线数据有帮助时,其表现显著优于标准LUCB。 我们还推导出一种实例相关的下界,该下界在某些情况下与LUCB-H的上界相匹配。 数值实验进一步展示了LUCB-H在有效结合离线数据方面的鲁棒性和适应性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.