计算机科学 > 计算机视觉与模式识别
[提交于 2025年4月3日
]
标题: GMR-Conv:一种使用高斯混合环的高效旋转和反射等变卷积核
标题: GMR-Conv: An Efficient Rotation and Reflection Equivariant Convolution Kernel Using Gaussian Mixture Rings
摘要: 对称性,即某些特征在几何变换下保持不变,常常可以用作设计卷积神经网络(CNN)的强大先验。尽管传统的CNN天然支持平移等变性,但将其扩展到旋转和反射等变性一直是个挑战,通常需要在等变性、效率和信息损失之间做出妥协。本文中,我们引入了高斯混合环卷积(GMR-Conv),这是一种高效的卷积核,利用加权高斯环的混合来平滑径向对称性。这种设计减少了圆形核的离散化误差,从而在不增加计算开销的情况下保持了鲁棒的旋转和反射等变性。我们还通过一种新颖的参数化和计算策略优化了GMR-Conv的空间和速度效率,使得在可接受的成本下可以使用更大的核。在八个分类数据集和一个分割数据集上的广泛实验表明,GMR-Conv不仅能够匹配传统CNN的性能,还可以在无方向数据的应用中超越它们。此外,GMR-Conv被证明比最先进的等变学习方法更鲁棒和高效。我们的工作提供了令人信服的经验证据,表明谨慎应用径向对称性可以缓解信息丢失的挑战,标志着等变网络架构的一个有希望的进步。代码可在https://github.com/XYPB/GMR-Conv获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.