凝聚态物理 > 无序系统与神经网络
[提交于 2025年8月28日
]
标题: 神经网络中特征学习的微观和集体特征
标题: Microscopic and collective signatures of feature learning in neural networks
摘要: 特征提取——识别数据相关属性的能力——是深度学习成功的关键因素。 然而,现有的预测理论很难阐明其本质,以至于对于特征学习的定义尚未达成共识。 在这个方向上,一个有希望的提示来自对神经网络训练动力学中准普遍特性的先前现象学观察,这些特性由特征几何的简单性质所展示。 我们在具有标准参数化的单隐层神经网络中的贝叶斯学习统计力学框架内解决这个问题。 在比例极限下(当网络宽度和训练集大小都很大时)的解析计算可以量化特征学习的指纹,包括集体特征(与流形几何相关)和微观特征(与权重相关)。 特别是,(i) 特征空间中不同类别流形之间的距离是温度的非单调函数,我们将其解释为在梯度下降(GD)动力学下观察到的现象的平衡对应物,以及 (ii) 网络中的微观可学习参数相对于无限宽度极限发生数据相关的位移,并发展出相关性。 这些结果表明,在后验预测分布为具有平凡重缩放先验的高斯过程回归的区域中,非平凡的特征学习正在发挥作用。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.