电气工程与系统科学 > 图像与视频处理
[提交于 2025年1月28日
(v1)
,最后修订 2025年3月26日 (此版本, v2)]
标题: 过拟合视频编解码器的改进编码方法
标题: Improved Encoding for Overfitted Video Codecs
摘要: 过拟合的神经网络视频编解码器提供的解码复杂度比其自编码器对应物小几个数量级。然而,这种低复杂度是以压缩效率有限为代价的,部分原因是它们难以捕捉准确的运动信息。本文提出使用光流估计算子来引导运动信息的学习。此外,还引入了联合率失真优化以改善不同帧之间的率分布。这些贡献在每个像素的解码复杂度保持在1300次乘法的同时,提供了接近传统编解码器HEVC的压缩性能,并且优于其他过拟合编解码器。本工作已在https://orange-opensource.github.io/Cool-Chic/开源。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.