统计学 > 方法论
[提交于 2025年9月23日
(v1)
,最后修订 2025年10月29日 (此版本, v3)]
标题: 凿刻:通过交互式机器学习进行强大且有效的子组选择
标题: Chiseling: Powerful and Valid Subgroup Selection via Interactive Machine Learning
摘要: 在回归和因果推断中,受控子群选择旨在以推断保证的方式,识别一个子群(定义为协变量空间的一个子集),该子群上的平均响应或处理效应高于给定阈值。 例如,在临床试验中,可能需要找到一个具有正平均处理效应的子群。 然而,现有方法要么缺乏推断保证,要么对子群的搜索施加了严格的限制,或者通过简单的数据分割牺牲了效率。 我们提出了一种称为“chiseling”的新框架,允许分析人员通过迭代缩小子群来交互式地精炼和测试候选子群。 唯一的要求是,收缩方向仅依赖于当前子群之外的点,但除此之外,分析人员可以利用任何先验信息或机器学习算法。 尽管具有这种灵活性,chiseling 在最小假设下控制发现的子群为零(例如,具有非正平均处理效应)的概率:例如,在随机实验中,这种推断有效性保证仅在有限矩条件下成立。 当应用于各种模拟数据集和一个实际调查实验时,chiseling 识别出的子群明显优于现有具有推断保证的方法。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.