经济学 > 计量经济学
[提交于 2025年7月15日
]
标题: 通过平滑方法对最优策略值和其他不规则泛函进行推断
标题: Inference on Optimal Policy Values and Other Irregular Functionals via Smoothing
摘要: 构建最优治疗策略值的置信区间是因果推理中的一个重要问题。 深入了解最优策略值可以指导制定奖励最大化的个性化治疗方案。 然而,由于定义最优值的函数不可微,因此用于执行推理的标准半参数方法无法直接应用。 现有的处理这种不可微性的方法大致分为两大阵营。 一类是基于构建最优值的平滑近似值的估计器。 这些方法计算量轻,但通常对结果回归做出不切实际的参数假设。 另一类是直接消除非平滑目标偏差的方法。这些方法并未对干扰函数做出参数假设,但它们要么需要计算大量难以处理的干扰估计,要么假设不切实际的 $L^\infty$ 个干扰收敛率,要么做出强边际假设以阻止对某种治疗无反应。 在本文中,我们重新探讨了构建不可微函数的平滑近似的问题。 通过仔细控制一阶偏差和二阶余数,我们证明了基于 softmax 平滑的估计器可用于估计指定为涉及干扰成分的得分最大值的参数。 具体而言,这包括作为特例的最优治疗策略的值。 我们的估计器获得了 $\sqrt{n}$ 的收敛率,避免了参数限制/不切实际的边际假设,并且通常具有统计有效性。
当前浏览上下文:
stat.ME
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.