计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月8日
]
标题: 核密度引导:通过模式搜索进行图像修复的推理时间缩放
标题: Kernel Density Steering: Inference-Time Scaling via Mode Seeking for Image Restoration
摘要: 扩散模型在图像恢复方面显示出前景,但现有方法常常在一致性和不良伪影方面遇到困难。 为了解决这个问题,我们引入了核密度引导(KDS),这是一种新颖的推理时间框架,通过显式局部模式搜索促进稳健、高保真输出。 KDS使用一个$N$粒子集合的扩散样本,从它们的集体输出中计算逐块核密度估计梯度。 这些梯度将每个粒子中的块引导至集合中识别出的共享、更高密度区域。 这种集体局部模式搜索机制,作为“集体智慧”,将样本从容易产生伪影的虚假模式中引导出来,这些模式可能由独立采样或模型不完善引起,并引导到更稳健、高保真的结构中。 这使我们能够在消耗更高计算资源的同时同时采样多个粒子,从而获得更高质量的样本。 作为一个即插即用的框架,KDS无需重新训练或外部验证器,可无缝集成到各种扩散采样器中。 广泛的数值验证表明,KDS在具有挑战性的现实世界超分辨率和图像修复任务中显著提高了定量和定性性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.