Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > econ > arXiv:2506.24007

帮助 | 高级搜索

经济学 > 计量经济学

arXiv:2506.24007 (econ)
[提交于 2025年6月30日 (v1) ,最后修订 2025年7月6日 (此版本, v2)]

标题: 最小最大和贝叶斯最优最佳臂识别:治疗选择的自适应实验设计

标题: Minimax and Bayes Optimal Best-arm Identification: Adaptive Experimental Design for Treatment Choice

Authors:Masahiro Kato
摘要: 本研究探讨了用于治疗选择的自适应实验设计,也称为固定预算最优臂识别。 我们考虑了一个包含治疗分配阶段和治疗选择阶段的自适应过程,并为此设置设计了一个自适应实验,以高效地识别最佳治疗臂,即具有最高期望结果的臂。 在我们设计的实验中,治疗分配阶段包括两个阶段。 第一阶段是预演阶段,在此阶段,我们将每个治疗臂均匀分配相等的比例,以消除明显次优的臂并估计结果方差。 在第二阶段,我们根据第一阶段估计的方差按比例分配治疗臂。 治疗分配阶段之后,该过程进入治疗选择阶段,在此阶段,我们选择样本均值最高的治疗臂作为最佳治疗臂的估计。 我们证明,这种单一设计在简单遗憾方面同时是渐近最小最大和贝叶斯最优的,其上界与我们的下界精确常数相匹配。 因此,我们设计的实验实现了尖锐的效率极限,而无需为最小最大和贝叶斯目标分别调整参数。
摘要: This study investigates adaptive experimental design for treatment choice, also known as fixed-budget best-arm identification. We consider an adaptive procedure consisting of a treatment-allocation phase followed by a treatment-choice phase, and we design an adaptive experiment for this setup to efficiently identify the best treatment arm, defined as the one with the highest expected outcome. In our designed experiment, the treatment-allocation phase consists of two stages. The first stage is a pilot phase, where we allocate each treatment arm uniformly with equal proportions to eliminate clearly suboptimal arms and estimate outcome variances. In the second stage, we allocate treatment arms in proportion to the variances estimated in the first stage. After the treatment-allocation phase, the procedure enters the treatment-choice phase, where we choose the treatment arm with the highest sample mean as our estimate of the best treatment arm. We prove that this single design is simultaneously asymptotically minimax and Bayes optimal for the simple regret, with upper bounds that match our lower bounds up to exact constants. Therefore, our designed experiment achieves the sharp efficiency limits without requiring separate tuning for minimax and Bayesian objectives.
主题: 计量经济学 (econ.EM) ; 机器学习 (cs.LG); 统计理论 (math.ST); 方法论 (stat.ME); 机器学习 (stat.ML)
引用方式: arXiv:2506.24007 [econ.EM]
  (或者 arXiv:2506.24007v2 [econ.EM] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.24007
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Masahiro Kato [查看电子邮件]
[v1] 星期一, 2025 年 6 月 30 日 16:11:44 UTC (50 KB)
[v2] 星期日, 2025 年 7 月 6 日 17:34:06 UTC (48 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
econ.EM
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
cs.LG
econ
math
math.ST
stat
stat.ME
stat.ML
stat.TH

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号