计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月15日
]
标题: 超越任务特定推理:抽象视觉推理的统一条件生成框架
标题: Beyond Task-Specific Reasoning: A Unified Conditional Generative Framework for Abstract Visual Reasoning
摘要: 抽象视觉推理(AVR)使人类能够快速发现并概括抽象规则以适应新场景。 在人工智能领域,设计具有类人AVR能力的智能系统一直是一个长期研究的主题。 最近,深度AVR求解器在各种AVR任务中取得了显著的成功。 然而,它们通常在不同任务中使用特定任务的设计或参数。 在这种范式下,解决新任务通常意味着重新训练模型,有时还需要调整模型结构,这增加了解决AVR问题的成本。 与特定任务的方法相反,本文提出了一种新的统一条件生成求解器(UCGS),旨在在一个统一框架中解决多个AVR任务。 首先,我们证明了一些著名的AVR任务可以重新表述为在问题面板中估计目标图像的可预测性的问题。 然后,我们说明在所提出的框架下,训练一个条件生成模型可以解决各种AVR任务。 实验表明,通过一次多任务训练,UCGS在各种AVR任务中表现出抽象推理能力。 特别是,UCGS表现出零样本推理的能力,使其能够在测试阶段对未见过的AVR任务的问题进行抽象推理。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.