统计学 > 机器学习
[提交于 2017年6月1日
]
标题: 监督分位数归一化
标题: Supervised Quantile Normalisation
摘要: 分位数规范化是一种流行的归一化方法,适用于受不需要的变化影响的数据,如图像、语音或基因组数据。 它对每个样本的特征值应用单调变换,以确保归一化后,它们遵循每个样本相同的靶分布。 然而,选择“好的”靶分布仍然主要是经验性的和启发式的,并且通常是独立于归一化数据的后续分析进行的。 我们建议将分位数规范化步骤与后续分析相结合,并与其他参数一起优化靶分布。 我们在归一化数据上估计线性模型的问题上说明了这一原则,并表明它导致了一个特定的低秩矩阵回归问题,可以高效解决。 我们通过模拟数据、图像和基因组数据来说明我们的方法的潜力,我们将该方法称为SUQUAN,在这些数据中,它的表现优于标准的分位数规范化。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.