计算机科学 > 计算机视觉与模式识别
[提交于 2024年8月16日
(v1)
,最后修订 2025年4月9日 (此版本, v2)]
标题: 草图参考:草图合成的多任务评估基准
标题: SketchRef: a Multi-Task Evaluation Benchmark for Sketch Synthesis
摘要: 速写是一种强大的艺术技巧,用于捕捉关于真实世界物体的关键视觉信息,并且在图像合成研究中越来越受到关注。然而,该领域缺乏一个统一的基准来评估各种合成方法的性能。为了解决这个问题,我们提出了SketchRef,这是第一个全面的多任务速写合成评估基准。SketchRef充分利用了速写与参考照片之间的共享特征。它引入了两个主要任务:类别预测和结构一致性估计,其中后者在以往的研究中很大程度上被忽视了。这些任务进一步分为四个领域的五个子任务:动物、常见物品、人体和面部。认识到速写中可识别性和简洁性之间的固有权衡,我们首次通过引入一种受简洁性约束的可识别性计算方法mRS来量化这种平衡,以确保公平和有意义的评估。为了验证我们的方法,我们收集了来自艺术爱好者的7,920份反馈,确认了我们提出的评估指标的有效性。此外,我们在基准上评估了现有的速写合成方法的表现,突出了它们的优点和缺点。我们希望通过这项研究建立一个标准化的基准,并为推进速写合成算法提供有价值的见解。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.