计算机科学 > 计算机视觉与模式识别
[提交于 2025年5月1日
(v1)
,最后修订 2025年5月5日 (此版本, v2)]
标题: 四元数小波条件扩散模型用于图像超分辨率
标题: Quaternion Wavelet-Conditioned Diffusion Models for Image Super-Resolution
摘要: 图像超分辨率是计算机视觉中的一个基础问题,其应用范围从医学影像到卫星分析。 从低分辨率输入重建高分辨率图像的能力对于增强下游任务(如目标检测和分割)至关重要。 虽然深度学习显著推进了超分辨率(SR),但在高放大因子下实现具有精细细节和逼真纹理的高质量重建仍然具有挑战性。 最近利用扩散模型的方法展示了有希望的结果,但它们通常难以在感知质量与结构保真度之间取得平衡。 在这项工作中,我们引入了ResQu,这是一种新颖的SR框架,它将四元数小波预处理框架与潜在扩散模型相结合,并引入了一种新的四元数小波和时间感知编码器。 与之前简单地在扩散模型中应用小波变换的方法不同,我们的方法通过利用四元数小波嵌入来增强条件过程,这些嵌入在去噪的不同阶段动态集成。 此外,我们还利用了基础模型(如Stable Diffusion)的生成先验。 在特定领域数据集上的广泛实验表明,我们的方法实现了卓越的SR结果,在许多情况下,在感知质量和标准评估指标方面优于现有方法。 代码将在修订过程后提供。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.