电气工程与系统科学 > 图像与视频处理
[提交于 2023年9月2日
]
标题: 基于机器学习的视频编解码器的全参考视频质量评估
标题: Full Reference Video Quality Assessment for Machine Learning-Based Video Codecs
摘要: 基于机器学习的视频编解码器在过去几年中取得了显著进展。 开发基于机器学习的视频编解码器的一个关键领域是准确的评估指标,该指标不需要昂贵且耗时的主观测试。 我们表明,那些为基于数字信号处理(DSP)的视频编解码器设计和训练的评估指标,在用于基于机器学习的视频编解码器时,与主观意见的相关性不高,因为基于机器学习的视频编解码器和传统视频编解码器产生的视频伪影差异较大。 我们提供了一个新的基于机器学习的视频编解码器视频数据集,这些视频已针对质量进行了准确标注。 我们还提出了一种新的全参考视频质量评估(FRVQA)模型,在模型级别上实现了0.99的皮尔逊相关系数(PCC)和0.99的斯皮尔曼等级相关系数(SRCC)。 我们将数据集和FRVQA模型开源,以帮助加速基于机器学习的视频编解码器的研究,并使其他人能够进一步改进FRVQA模型。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.