计算机科学 > 计算机视觉与模式识别
[提交于 2025年7月31日
]
标题: GeoExplorer:基于好奇心驱动探索的主动地理定位
标题: GeoExplorer: Active Geo-localization with Curiosity-Driven Exploration
摘要: 主动地理定位(AGL)是将目标(以各种模态表示,例如航拍图像、地面图像或文本)定位在预定义的搜索区域内的任务。 当前方法将AGL视为一种基于距离的奖励的目标达成强化学习(RL)问题。 它们通过隐式学习来最小化与目标的相对距离来定位目标。 然而,当距离估计变得具有挑战性或遇到未见过的目标和环境时,由于训练期间学到的探索策略不够可靠,智能体会表现出鲁棒性和泛化能力下降的问题。 在本文中,我们提出了GeoExplorer,这是一种结合了通过内在奖励驱动的探索的AGL代理。 与基于距离的奖励不同,我们的基于好奇心的奖励是目标无关的,能够基于有效的环境建模进行稳健、多样且上下文相关的探索。 这些能力已在四个AGL基准测试中通过大量实验得到验证,证明了GeoExplorer在各种环境中的有效性和泛化能力,特别是在定位不熟悉的目标和环境方面。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.