计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月7日
(v1)
,最后修订 2025年7月8日 (此版本, v2)]
标题: PointGAC:面向几何的代码本用于掩码点云建模
标题: PointGAC: Geometric-Aware Codebook for Masked Point Cloud Modeling
摘要: 大多数遮罩点云建模(MPM)方法遵循回归范式来重建遮罩区域的坐标或特征。 然而,它们往往过度约束模型以学习遮罩区域的细节,导致无法捕捉泛化的特征。 为了解决这一限制,我们提出了\textbf{\textit{点GAC}},一种新颖的基于聚类的 MPM 方法,旨在对齐遮罩区域的特征分布。 特别地,它具有一个在线代码本引导的师生框架。 首先,它提出了一种几何感知的分块策略以提取初始块。 然后,教师模型通过基于完整块特征的在线 k-means 更新代码本。 此过程促进了代码本向量成为聚类中心。 随后,我们将未遮罩的特征分配到其对应的聚类中心,并且学生模型对重建的遮罩特征的分配进行对齐。 这种策略专注于识别遮罩特征所属的聚类中心,使模型能够学习更泛化的特征表示。 得益于提出的代码本维护机制,代码本向量被主动更新,这进一步提高了语义特征学习的效率。 实验验证了所提方法在各种下游任务中的有效性。 代码可在 https://github.com/LAB123-tech/PointGAC 获得。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.