计算机科学 > 机器学习
[提交于 2025年10月13日
]
标题: 生成式AI的薛定谔桥:软约束公式和收敛性分析
标题: Schrödinger bridge for generative AI: Soft-constrained formulation and convergence analysis
摘要: 生成式人工智能可以被表述为学习一个将简单参考测度映射到复杂数据分布的模型的问题,并且由于它们在通过熵正则化随机动力学在预设边缘之间进行插值方面的共同性质,最近与经典的Schrödinger桥问题(SBPs)有了强烈的联系。 然而,经典的SBP施加了硬终端约束,这在实际实现中经常导致不稳定性,尤其是在高维或数据稀缺的场景中。 为了解决这个挑战,我们遵循所谓的软约束Schrödinger桥问题(SCSBP)的想法,在这种情况下,终端约束被一个一般的惩罚函数所取代。 这种放松导致了一个更灵活的麦肯-弗拉索夫类型的随机控制公式。 我们证明了所有惩罚水平下最优解的存在性,并证明了随着惩罚的增长,控制和价值函数以线性速率收敛到经典SBP的控制和价值函数。 我们的分析基于Doob的h变换表示、Schrödinger势的稳定性结果、Gamma收敛,以及一个新颖的固定点论证,该论证将测度空间上的优化问题与一个辅助熵最优传输问题耦合在一起。 这些结果不仅为软约束桥提供了第一个定量收敛保证,还揭示了惩罚正则化如何促进稳健的生成建模、微调和迁移学习。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.