统计学 > 方法论
标题: COMBSS:通过连续优化的最佳子集选择
标题: COMBSS: Best Subset Selection via Continuous Optimization
摘要: 我们考虑线性回归中的最佳子集选择问题,其中目标是为每个模型大小$k$找到一组$k$特征,这些特征能最好地拟合响应。 当可用特征的总数相对于数据样本的数量非常大时,这尤其具有挑战性。 我们提出了 COMBSS,一种基于连续优化的新方法,该方法识别出一个解路径,即一组不同大小的模型,这些模型包含线性回归中最佳子集的候选。 COMBSS 表现出非常快的速度,使得当特征数量远远超过数千时,可以进行子集选择。 给出了仿真结果,以突出 COMBSS 与现有流行方法(如向前逐步选择、Lasso 和混合整数优化)相比的性能。 由于整体表现优异,将最佳子集选择问题表述为连续优化问题,为各种回归模型的特征提取开辟了新的研究方向。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.