计算机科学 > 计算机视觉与模式识别
[提交于 2025年8月7日
]
标题: 旋转等变的任意尺度图像超分辨率
标题: Rotation Equivariant Arbitrary-scale Image Super-Resolution
摘要: 任意尺度图像超分辨率(ASISR),是计算机视觉中的一个近期热门话题,旨在从低分辨率输入图像中实现任意尺度的高分辨率恢复。 该任务通过将图像表示为连续隐函数来实现,涉及两个基本模块,基于深度网络的编码器和隐式神经表示(INR)模块。 尽管取得了显著进展,这种高度不适定的设置中存在一个关键挑战,即许多常见的几何模式,如重复纹理、边缘或形状,在低分辨率图像中严重扭曲和变形,自然导致其高分辨率恢复中出现意外的伪影。 因此,将旋转等变性嵌入到ASISR网络中是必要的,因为已广泛证明这种增强能够使恢复过程忠实保持输入图像中几何模式的原始方向和结构完整性。 受此启发,我们在本研究中努力构建一种具有旋转等变性的ASISR方法。 具体而言,我们精心重新设计了INR和编码器模块的基本架构,除了传统ASISR网络的能力外,还融入了内在的旋转等变能力。 通过这种改进,ASISR网络可以首次在从输入到输出的端到端旋转等变性得到保持的情况下进行实现。 我们还提供了坚实的理论分析来评估其内在等变误差,证明了嵌入这种等变结构的固有性质。 所提出方法的优势通过在模拟和真实数据集上进行的实验得到了证实。 我们还验证了所提出的框架可以以即插即用的方式轻松集成到当前的ASISR方法中,以进一步提升其性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.