计算机科学 > 机器学习
[提交于 2019年9月18日
(v1)
,最后修订 2020年3月10日 (此版本, v2)]
标题: 决策导向数据分解
标题: Decision-Directed Data Decomposition
摘要: 我们提出了一种名为决策导向数据分解(D4)的算法,该算法将数据集分解为两个部分。第一个部分包含了指定监督学习任务所需大部分有用信息;第二个正交部分关于该任务包含的信息很少,但保留了未针对的目标关联和信息。该算法简单且可扩展。我们在图像和文本处理领域展示了它的应用实例。我们的结果显示:1)在图像表示空间后验应用D4可以去除指定概念的信息而不影响其他概念;2)在某些情况下,D4能够提升预测泛化能力;3)对词嵌入表示应用D4可以在去偏见方面产生最先进的结果。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.