统计学 > 方法论
[提交于 2022年5月5日
(此版本)
, 最新版本 2023年11月25日 (v3)
]
标题: COMBSS:通过连续优化的最佳子集选择
标题: COMBSS: Best Subset Selection via Continuous Optimization
摘要: 我们考虑线性回归中的最佳子集选择问题,其中目标是为每个模型大小$k$找到最佳拟合响应的$k$个特征的子集。 当可用特征总数相对于数据样本数量非常大时,这尤其具有挑战性。 我们提出了 COMBSS,一种基于连续优化的新方法,可以直接解决线性回归中的最佳子集选择问题。 COMBSS 被证明非常快速,可能使特征数量远远超过数千时的最佳子集选择成为可能。 通过模拟结果展示了 COMBSS 在与现有的流行非穷举方法(如向前逐步选择和 Lasso)以及穷举方法(如混合整数优化)进行比较时的性能。 由于整体性能优异,将最佳子集选择问题表述为连续优化问题为各种回归模型的特征提取开辟了新的研究方向。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.