电气工程与系统科学 > 图像与视频处理
[提交于 2025年4月8日
(v1)
,最后修订 2025年8月8日 (此版本, v2)]
标题: POMATO:将点图匹配与时间运动相结合用于动态3D重建
标题: POMATO: Marrying Pointmap Matching with Temporal Motion for Dynamic 3D Reconstruction
摘要: 动态场景中的3D重建主要依赖于几何估计和匹配模块的结合,其中后者任务对于区分动态区域至关重要,这有助于减轻由相机和物体运动引入的干扰。 此外,匹配模块显式建模物体运动,使特定目标的跟踪成为可能,并推动了复杂场景中的运动理解。 最近,DUSt3R中提出的点图表示建议了一种统一几何估计和匹配的潜在解决方案,但它在动态区域中仍存在模糊匹配的问题,这可能会阻碍进一步的改进。 在本工作中,我们提出了POMATO,这是一种通过将点图匹配与时间运动相结合的动态3D重建统一框架。 具体来说,我们的方法首先通过将不同视图中动态和静态区域的RGB像素映射到统一坐标系内的3D点图,学习显式的匹配关系。 此外,我们引入了一个用于动态运动的时间运动模块,确保不同帧之间的尺度一致性,并提升需要精确几何和可靠匹配的任务性能,尤其是在3D点跟踪方面。 我们通过在多个下游任务中展示出色的表现,证明了所提出的点图匹配和时间融合范式的有效性,包括视频深度估计、3D点跟踪和姿态估计。 代码和模型可在https://github.com/wyddmw/POMATO公开获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.