统计学 > 机器学习
[提交于 2025年4月3日
]
标题: 具有机器学习的流形分析发现
标题: Analytical Discovery of Manifold with Machine Learning
摘要: 理解高维数据中的低维结构对于复杂数据集的可视化、解释和去噪至关重要。尽管流形学习技术取得了进展,但一些关键挑战——如全局洞察力有限和缺乏可解释的分析描述——仍未得到解决。 在这项工作中,我们引入了一个新的框架,即使用自编码的全局解析流形学习(GAMLA)。GAMLA 在自编码框架内采用两轮训练过程,以推导出底层流形的特征表示和互补表示。通过特征表示,流形由一个参数化函数表示,该函数展开流形以提供全局坐标。而通过互补表示,则开发了近似的显式流形描述,为高维数据集下的平滑流形提供了全局和解析的表示。这使得可以解析推导出曲率和法向量等几何属性。此外,我们发现这两种表示一起分解了整个潜在空间,并且因此能够表征围绕流形的局部空间结构,在异常检测和分类中表现出特别的有效性。通过在基准数据集和现实应用上的大量实验,GAMLA 展现了其在实现计算效率和可解释性的同时提供精确几何和结构洞见的能力。这一框架弥合了数据驱动的流形学习与解析几何之间的差距,为探索复杂数据集的内在特性提供了一种多功能工具。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.