电气工程与系统科学 > 图像与视频处理
[提交于 2024年12月31日
(v1)
,最后修订 2025年1月7日 (此版本, v2)]
标题: GDSR:通过小波损失的双分支网络进行全局细节集成的遥感图像超分辨率
标题: GDSR: Global-Detail Integration through Dual-Branch Network with Wavelet Losses for Remote Sensing Image Super-Resolution
摘要: 近年来,包括卷积神经网络、Transformer和状态空间模型在内的深度神经网络在遥感图像(RSI)超分辨率(SR)方面取得了显著进展。然而,现有的SR方法通常忽略了全局和局部依赖之间的互补关系。这些方法要么专注于捕捉局部信息,要么优先考虑全局信息,导致模型无法同时有效地捕捉全局和局部特征。此外,当应用于大规模RSI时,它们的计算成本变得难以承受。为了解决这些挑战,我们引入了Receptance加权键值(RWKV)在RSI-SR中的新应用,该方法以线性复杂度捕捉长距离依赖关系。为了同时建模全局和局部特征,我们提出了全局-细节双分支结构GDSR,通过并行化RWKV和卷积操作来进行SR重建,以处理大规模RSI。此外,我们在两个分支之间引入了全局-细节重建模块(GDRM),以弥补它们的互补作用。此外,我们提出了小波损失,这是一种能有效捕捉图像中高频细节信息的损失函数,从而提高SR的视觉质量,特别是在细节重建方面。在多个基准测试中进行了大量实验,包括AID、AID_CDM、RSSRD-QH和RSSRD-QH_CDM,结果表明,GSDR在PSNR上平均比最先进的基于Transformer的方法HAT高出0.05 dB,同时仅使用其63%的参数和51%的FLOPs,推理速度提高了2.9倍。此外,小波损失在各种架构中表现出优异的泛化能力,为RSI-SR增强提供了一个新的视角。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.