计算机科学 > 计算机视觉与模式识别
[提交于 2025年6月3日
]
标题: 利用不完美标签的弱监督增强单目高度估计
标题: Enhancing Monocular Height Estimation via Weak Supervision from Imperfect Labels
摘要: 单目高度估测被认为是遥感领域中最高效且最具成本效益的三维感知手段,并且自深度学习出现以来就吸引了大量关注。尽管训练神经网络需要大量的数据,但完美的标签数据却非常稀缺,且仅限于发达地区可用。因此,训练出的模型缺乏泛化能力,这限制了现有方法大规模应用的潜力。我们首次通过引入带有不完美标签的数据来训练逐像素高度估测网络(包括与高质量标签相比存在不完整、不精确和不准确的标签)来解决这一问题。我们提出了一种基于集成的流水线,该流水线可兼容任何单目高度估测网络。考虑到噪声标签、领域迁移以及高度值长尾分布的挑战,我们精心设计了架构和损失函数,利用平衡软损失和序数约束的弱监督方式从不完美标签中挖掘隐藏信息。我们在两个具有不同分辨率的数据集DFC23(0.5到1米)和GBH(3米)上进行了广泛的实验。结果显示,所提出的流水线相较于基线模型在各种域上的性能更加均衡,分别使DFC23和GBH的平均均方根误差改善了22.94%和18.62%。通过消融研究验证了每个设计组件的有效性。代码可在https://github.com/zhu-xlab/weakim2h获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.