计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月3日
]
标题: CanonSwap:通过规范空间调制实现高保真且一致的视频人脸交换
标题: CanonSwap: High-Fidelity and Consistent Video Face Swapping via Canonical Space Modulation
摘要: 视频人脸交换旨在解决两个主要挑战:有效地将源身份转移到目标视频中,并准确保留目标面部的动态属性,例如头部姿态、面部表情、唇形同步,\etc 。 现有方法主要专注于实现高质量的身份转移,但往往在保持目标面部的动态属性方面表现不足,导致结果不一致。 我们将这一问题归因于视频中面部外观和运动的固有耦合性。 为了解决这个问题,我们提出了CanonSwap,一种新的视频人脸交换框架,该框架能够将运动信息与外观信息解耦。 具体而言, CanonSwap首先消除与运动相关的信息,使得在统一的标准空间内进行身份修改成为可能。 随后,交换后的特征被重新整合到原始视频空间中,确保目标面部动态属性的保留。 为了进一步实现精确的身份转移,同时减少伪影并增强真实感,我们设计了一个部分身份调制模块,该模块使用空间掩码自适应地整合源身份特征,以限制对面部区域的修改。 此外,我们引入了几种细粒度的同步度量标准,以全面评估视频人脸交换方法的性能。 大量实验表明,我们的方法在视觉质量、时间一致性和身份保留方面显著优于现有方法。 我们的项目页面可在 https://luoxyhappy.github.io/CanonSwap/ 公开访问。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.