统计学 > 方法论
[提交于 2022年5月3日
(v1)
,最后修订 2023年7月14日 (此版本, v2)]
标题: 因果正则化:样本内风险与样本外风险保证之间的权衡
标题: Causal Regularization: On the trade-off between in-sample risk and out-of-sample risk guarantees
摘要: 近年来,引入了许多在实践中处理因果关系的方法,例如倾向得分匹配、PC算法和不变因果预测。 除了具有解释上的吸引力,因果模型提供了最佳的样本外预测保证。 在本文中,我们研究了从样本内数据中识别因果类似模型的问题,这些模型在从一组协变量预测目标变量时提供样本外风险保证。 与普通最小二乘法相比,普通最小二乘法在样本内风险上表现最佳但样本外保证有限,而因果模型则具有最佳的样本外保证,但在样本内风险上表现较差。 通过定义这些属性之间的权衡,我们引入了$\textit{causal regularization}$。 随着正则化的增加,它提供了在子样本中风险更稳定的估计量,但以增加整体样本内风险为代价。 增加的风险稳定性被证明可以带来样本外风险保证。 我们为所有模型提供了有限样本风险边界,并证明了交叉验证对于达到这些边界是充分的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.