计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月22日
]
标题: 稀疏视图三维重建:最新进展与开放挑战
标题: Sparse-View 3D Reconstruction: Recent Advances and Open Challenges
摘要: 稀疏视图三维重建在密集图像采集不切实际的应用中至关重要,例如机器人技术、增强现实/虚拟现实(AR/VR)和自主系统。在这些情况下,最小的图像重叠阻止了可靠的对应匹配,导致传统方法如基于运动的结构(SfM)和多视图立体(MVS)失败。本综述介绍了神经隐式模型(例如NeRF及其正则化版本)、基于显式点云的方法(例如3D高斯点绘制)以及利用扩散和视觉基础模型(VFMs)先验的混合框架的最新进展。我们分析了几何正则化、显式形状建模和生成推理如何用于减轻稀疏视图设置中的伪影,如浮动物和姿态模糊。在标准基准上的比较结果揭示了重建精度、效率和泛化之间的关键权衡。与以往的综述不同,我们的综述提供了一个统一的观点,涵盖基于几何、神经隐式和生成(基于扩散)方法。我们强调了领域泛化和无姿态重建的持续挑战,并概述了开发3D原生生成先验和实现实时、无约束的稀疏视图重建的未来方向。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.