计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月1日
]
标题: LoD-Loc v2:使用显式轮廓对齐在低细节层次城市模型上的航空视觉定位
标题: LoD-Loc v2: Aerial Visual Localization over Low Level-of-Detail City Models using Explicit Silhouette Alignment
摘要: 我们提出了一种新的方法,用于在低细节层次(LoD)城市模型上进行空中视觉定位。基于线框对齐的先前方法LoD-Loc通过利用LoD模型展示了有希望的定位结果。然而,LoD-Loc主要依赖于高LoD(LoD3或LoD2)城市模型,但大多数可用模型以及许多国家计划建设的全国性模型是低LoD(LoD1)。因此,在低LoD城市模型上实现定位可以释放无人机在全球城市定位中的潜力。为了解决这些问题,我们引入了LoD-Loc v2,它采用一种从粗到细的策略,使用显式的轮廓对齐来实现在空中低LoD城市模型上的准确定位。具体来说,给定一个查询图像,LoD-Loc v2首先应用一个建筑物分割网络来生成建筑物轮廓。然后,在粗略姿态选择阶段,我们在先验姿态周围均匀采样姿态假设,构建姿态成本体积以表示姿态概率分布。体积中的每个成本衡量投影轮廓和预测轮廓之间的对齐程度。我们选择值最大的姿态作为粗略姿态。在精细姿态估计阶段,使用一种结合多光束跟踪方法的粒子过滤方法,以高效探索假设空间并获得最终的姿态估计。为了进一步促进该领域的研究,我们发布了两个包含LoD1城市模型的数据集,覆盖10.7公里,并附有真实的RGB查询和真实姿态标注。实验结果表明,LoD-Loc v2在高LoD模型上提高了估计精度,并首次实现了在低LoD模型上的定位。此外,它大大优于最先进的基线方法,甚至超越了基于纹理模型的方法,并扩大了收敛区域以适应更大的先验误差。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.