计算机科学 > 机器学习
[提交于 2020年2月29日
]
标题: 深度可微森林与稀疏注意力用于表格数据
标题: Deep differentiable forest with sparse attention for the tabular data
摘要: 我们提出了一种深度可微森林的一般架构及其稀疏注意力机制。 可微森林结合了树结构和神经网络的优点。 其结构是一个简单的二叉树,易于使用和理解。 它具有完全的可微性,所有变量都是可学习的参数。 我们将通过基于梯度的优化方法对其进行训练,这种方法在深度CNN的训练中表现出强大的能力。 我们发现并分析了可微森林中的注意力机制。 也就是说,每个决策仅依赖于少数重要的特征,其他特征是无关的。 注意力始终是稀疏的。 基于这一观察,我们通过数据感知初始化来提高其稀疏性。 我们使用属性重要性来初始化注意力权重。 然后,学习到的权重比随机初始化的权重要稀疏得多。 我们在一些大型表格数据集上的实验表明,可微森林的准确性高于GBDT,这是表格数据集的最先进算法。 源代码可在 https://github.com/closest-git/QuantumForest 获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.