统计学 > 方法论
[提交于 2025年10月9日
]
标题: 用贝叶斯回归树集成拟合稀疏高维变系数模型
标题: Fitting sparse high-dimensional varying-coefficient models with Bayesian regression tree ensembles
摘要: 通过允许线性回归模型中$p$协变量的影响作为$R$额外效应修饰因子的函数而变化,变系数模型(VCMs)在经典统计中流行的可解释但刚性的参数模型和机器学习中流行的灵活但不透明的方法之间取得了引人注目的平衡。但在高维情况下,当$p$和/或$R$超过观测数时,现有的拟合VCM方法无法识别哪些协变量具有非零效应以及哪些效应修饰因子驱动这些效应。我们提出了sparseVCBART,这是一种完全贝叶斯模型,它用回归树集成近似VCM中的每个系数函数,并通过回归树叶输出的全局-局部收缩先验和每棵树分割概率的分层先验来鼓励稀疏性。我们证明了sparseVCBART后验以接近最小最大最优的速率收缩,自动适应真实系数函数的未知稀疏结构和平滑性。与现有最先进的方法相比,sparseVCBART实现了具有竞争力的预测准确性,并且不确定性区间明显更窄且校准更好,尤其是在零协变量效应的情况下。我们使用sparseVCBART来研究人际对话对偏见的影响如何根据受访者的政治和人口统计特征而变化。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.