电气工程与系统科学 > 图像与视频处理
[提交于 2024年12月31日
(v1)
,最后修订 2025年7月28日 (此版本, v3)]
标题: GDSR:通过小波损失的双分支网络进行全局细节集成的遥感图像超分辨率
标题: GDSR: Global-Detail Integration through Dual-Branch Network with Wavelet Losses for Remote Sensing Image Super-Resolution
摘要: 近年来,深度神经网络,包括卷积神经网络、Transformer 和状态空间模型,在遥感图像(RSI)超分辨率(SR)方面取得了显著进展。然而,现有的 SR 方法通常忽略了全局和局部依赖之间的互补关系。这些方法要么专注于捕捉局部信息,要么优先考虑全局信息,这导致模型无法同时有效地捕捉全局和局部特征。此外,当应用于大规模 RSI 时,它们的计算成本变得难以承受。为了解决这些挑战,我们引入了接收权重键值(RWKV)在 RSI-SR 中的新应用,该方法以线性复杂度捕捉长距离依赖关系。为了同时建模全局和局部特征,我们提出了全局-细节双分支结构 GDSR,通过并行 RWKV 和卷积操作来处理大规模 RSI 实现 SR。此外,我们在两个分支之间引入了全局-细节重建模块(GDRM),以弥补它们的互补作用。此外,我们提出了双组多尺度小波损失,通过双组子带策略和跨分辨率频率对齐的小波域约束机制,以提高 RSI-SR 的重建保真度。在 AID、UCMerced 和 RSSRD-QH 等多个基准数据集上,使用两种退化方法进行的大量实验表明,GSDR 在 PSNR 上平均比最先进的基于 Transformer 的方法 HAT 提高了 0.09 dB,同时仅使用其 63% 的参数和 51% 的 FLOPs,推理速度提高了 3.2 倍。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.