统计学 > 机器学习
[提交于 2022年5月3日
]
标题: 可扩展的正则化联合混合模型
标题: Scalable Regularised Joint Mixture Models
摘要: 在许多应用中,数据在潜在组具有不同底层分布的意义上可能是异构的。当预测模型应用于此类数据时,异构性可能会影响预测性能和可解释性。基于无监督学习和正则化回归交叉领域的进展,我们提出了一种针对异构数据的方法,该方法允许联合学习(i)显式的多变量特征分布,(ii)高维回归模型和(iii)潜在组标签,其中(i)和(ii)特定于潜在组,并且这两个元素共同影响(iii)。这种方法在高维情况下表现出显著效果,通过数据降维实现计算效率的同时,采用重新加权方案保留关键信号,即使特征数量很大时也是如此。我们详细讨论了这些方面及其对建模和计算的影响,包括EM算法的收敛性。该方法模块化,可以结合适合特定应用的数据降维和高维估计器。我们展示了广泛的模拟和真实数据实验的结果,包括高度非高斯的数据。我们的结果显示,在生物医学等领域,这种高效有效的方法适用于需要可解释预测和显式特征空间模型的情况,但隐藏的异质性可能是一个问题。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.