计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月23日
(此版本)
, 最新版本 2025年7月28日 (v2)
]
标题: Vec2Face+ 用于人脸数据集生成
标题: Vec2Face+ for Face Dataset Generation
摘要: 当将身份合成作为人脸识别的训练数据时,通常认为大的类间可分性和类内属性变化对于合成高质量的数据集是必不可少的。 % 这种信念通常是正确的,这也是我们的目标。 然而,当增加类内变化时,现有方法忽略了保持类内身份一致性的必要性。 % 为了解决这个问题并生成高质量的人脸训练数据,我们提出了Vec2Face+,这是一种生成模型,可以直接从图像特征生成图像,并允许对人脸身份和属性进行连续且容易的控制。 使用Vec2Face+,我们通过三种策略获得具有适当类间可分性、类内变化和身份一致性的数据集:1)我们采样与其它向量足够不同的向量以生成良好分离的身份;2)我们提出了一种AttrOP算法来增加一般属性的变化;3)我们提出了基于LoRA的姿态控制,用于生成具有侧面头部姿势的图像,这比AttrOP更高效且保留身份。 % 我们系统生成了VFace10K,一个包含10K身份的合成人脸数据集,使得FR模型在七个真实世界测试集中达到最先进的准确率。 将规模扩展到4M和12M图像,相应的VFace100K和VFace300K数据集在五个真实世界测试集中比真实世界训练数据集CASIA-WebFace具有更高的准确率。 这是第一次合成数据集在平均准确率上超过了CASIA-WebFace。 此外,我们发现只有1个合成数据集在双胞胎验证中优于随机猜测(\emph{即,50%}),并且使用合成身份训练的模型比使用真实身份训练的模型更具偏差。 这些都是未来研究的重要方面。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.