数学 > 优化与控制
[提交于 2025年6月12日
(v1)
,最后修订 2025年8月1日 (此版本, v3)]
标题: 不确定性下的决策制定的吉廷斯指数:一个设计原则
标题: The Gittins Index: A Design Principle for Decision-Making Under Uncertainty
摘要: Gittins指数是一种能够最优解决各种涉及不确定性的决策问题的工具,包括多臂老虎机问题、减少队列中的平均延迟以及类似“普罗米修斯之盒”模型的搜索问题。 然而,尽管有上述例子以及后来的扩展,Gittins指数能够完美最优求解的问题空间是有限的,与其它多臂老虎机算法相比,其定义更为微妙。 因此,Gittins指数通常被视为一个理论上的重要概念,而不是用于解决决策问题的实际工具。 本教程的目标是展示Gittins指数可以被成功应用于实际问题。 我们首先通过示例来介绍Gittins指数,然后逐步讲解它所解决的几个问题——有些是最佳求解,有些是次优求解但仍然表现出色。 在后一类中,两个实际应用亮点是将Gittins指数应用于贝叶斯优化,以及将Gittins指数应用于减少队列中的尾部延迟。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.