计算机科学 > 图形学
[提交于 2025年6月28日
]
标题: VoteSplat:霍夫投票高斯点云投影用于三维场景理解
标题: VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding
摘要: 3D高斯点云(3DGS)已成为高质量、实时渲染的新视角合成3D场景的强力工具。 然而,现有方法主要关注几何和外观建模,缺乏更深层次的场景理解,同时带来了高昂的训练成本,这使得原本简化的可微分渲染流程变得复杂。 为此,我们提出了VoteSplat,一种新颖的3D场景理解框架,该框架将霍夫投票与3DGS相结合。 具体来说,使用分割一切模型(SAM)进行实例分割,提取物体并生成2D投票图。 然后我们将空间偏移向量嵌入到高斯基元中。 这些偏移通过将其与2D图像投票相关联来构建3D空间投票,而深度失真约束则在深度轴上细化定位。 对于开放词汇物体定位,VoteSplat通过投票点将2D图像语义映射到3D点云,降低了与高维CLIP特征相关的训练成本,同时保持了语义的明确性。 大量实验表明VoteSplat在开放词汇3D实例定位、3D点云理解、基于点击的3D物体定位、层次分割和消融研究中的有效性。 我们的代码可在https://sy-ja.github.io/votesplat/获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.