统计学 > 机器学习
[提交于 2025年6月26日
(v1)
,最后修订 2025年7月14日 (此版本, v2)]
标题: 超球面变分自编码器使用高效的球面柯西分布
标题: Hyperspherical Variational Autoencoders Using Efficient Spherical Cauchy Distribution
摘要: 我们提出了一种新颖的变分自编码器(VAE)架构,该架构采用球面柯西(spCauchy)潜在分布。 与传统的高斯潜在空间或广泛使用的冯·米塞斯-费舍尔(vMF)分布不同,spCauchy提供了更自然的超球形潜在变量表示,在保持灵活性的同时更好地捕捉方向数据。 其重尾特性可防止过度正则化,确保潜在空间的有效利用,同时提供更具表现力的表示。 此外,spCauchy避免了vMF固有的数值不稳定性,这些不稳定性源于涉及贝塞尔函数的归一化常数计算。 相反,它通过莫比乌斯变换实现完全可微且高效的重参数化技巧,从而实现稳定和可扩展的训练。 KL散度可以通过一个快速收敛的幂级数进行计算,消除了与超几何函数比值评估相关的下溢或上溢问题。 这些特性使spCauchy成为VAE的一个有吸引力的替代方案,在高维生成建模中既具有理论优势又具有实际效率。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.