计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月22日
]
标题: 基于吸引力场图的Transformer建筑边界重建
标题: Transformer Based Building Boundary Reconstruction using Attraction Field Maps
摘要: 近年来,围绕地球运行的远程卫星数量显著增加,它们传输大量高分辨率视觉数据,以支持民事、公共和军事领域的各种应用。 在这些应用中,建筑物环境的空间地图生成和更新变得至关重要,因为卫星提供了广泛覆盖和详细图像。 然而,从卫星图像重建空间地图是一个复杂的计算机视觉任务,需要创建高级对象表示,如基本形状,以准确捕捉建筑物环境。 尽管过去十年在使用视觉数据进行对象检测和表示方面取得了显著进展,但基于基本形状的对象表示仍然是计算机视觉中的一个持续挑战。 因此,高质量的空间地图通常依赖于劳动密集和手动的过程。 本文介绍了一种新颖的深度学习方法,利用图卷积网络(GCNs)来解决建筑物轮廓重建中的这些挑战。 所提出的方法通过将几何规律纳入建筑物边界、整合多尺度和多分辨率特征以及将吸引力场图嵌入网络来提高性能。 这些创新为从单个卫星图像自动提取建筑物轮廓提供了可扩展且精确的解决方案,为城市规划、灾害管理和大规模空间分析中的有影响力的应用铺平了道路。 我们的模型,Decoupled-PolyGCN,在AP上比现有方法提高了6%,在AR上提高了10%,证明了其在多样和具有挑战性的场景中提供准确和规范化建筑物轮廓的能力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.