电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月3日
]
标题: SNeRV:视频的光谱保持神经表示
标题: SNeRV: Spectra-preserving Neural Representation for Video
摘要: 神经视频表示(NeRV),采用神经网络对视频信号进行参数化,为视频表示引入了一种新方法。 然而,现有的基于NeRV的方法由于频谱偏差,在捕捉精细的空间细节和运动模式方面存在困难,其中神经网络学习高频(HF)成分的速度比低频(LF)成分慢。 在本文中,我们提出了频谱保持的NeRV(SNeRV),作为一种新方法,通过有效处理各种频率成分来增强隐式视频表示。 SNeRV使用二维离散小波变换(DWT)将视频分解为LF和HF特征,保留空间结构并直接解决频谱偏差问题。 为了平衡紧凑性,我们仅编码LF成分,而包含精细纹理的HF成分由解码器生成。 集成到主干中的专用模块,包括多分辨率融合单元(MFU)和高频恢复器(HFR),有助于表示。 此外,我们通过将扩展作为时间域的额外频率分解,将SNeRV扩展以有效捕捉相邻视频帧之间的时序相关性。 这种方法使我们能够将时空LF特征嵌入网络中,使用时间扩展的上采样块(TUBs)。 实验结果表明,SNeRV在捕捉精细细节方面优于现有的NeRV模型,并实现了增强的重建效果,使其成为隐式视频表示领域的一种有前景的方法。 代码可在 https://github.com/qwertja/SNeRV 获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.