计算机科学 > 计算机视觉与模式识别
[提交于 2025年6月3日
]
标题: 通过互学习和类分布正则化的广义类别发现
标题: Generalized Category Discovery via Reciprocal Learning and Class-Wise Distribution Regularization
摘要: 广义类别发现(GCD)旨在通过利用有标注样本的基础知识来识别未标注样本,其中未标注集合包括基础类和新颖类。 由于聚类方法在推理时耗时较长,基于参数的方法变得更加流行。 然而,近期基于参数的方法由于自监督的不可靠性,在基础区分方面表现较差。 为了解决这个问题,我们提出了一种互学习框架(RLF),该框架引入了一个专注于基础分类的辅助分支。 在训练过程中,主分支将伪基础样本过滤到辅助分支。 作为响应,辅助分支为主分支提供了更可靠的软标签,从而形成良性循环。 此外,我们引入了类分布正则化(CDR),以减轻对基础类别的学习偏差。 CDR本质上提高了未标注数据的预测置信度,并提升了新颖类别的性能。 结合这两个组件,我们提出的方法RLCD在所有类别上都取得了卓越的性能,且额外计算量可以忽略不计。 在七个GCD数据集上的综合实验验证了其优越性。 我们的代码可在https://github.com/APORduo/RLCD获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.