计算机科学 > 机器人技术
[提交于 2025年7月1日
]
标题: VISTA:开放词汇、任务相关的机器人探索与在线语义高斯点云
标题: VISTA: Open-Vocabulary, Task-Relevant Robot Exploration with Online Semantic Gaussian Splatting
摘要: 我们提出VISTA(基于视角的图像选择与语义任务感知),这是一种用于机器人规划信息轨迹以提高任务完成相关区域的3D地图质量的主动探索方法。 给定一个开放词汇搜索指令(例如,“找到一个人”),VISTA使机器人能够探索其环境以寻找感兴趣的物体,同时构建场景的实时语义3D高斯点云重建。 机器人通过规划分阶段的轨迹来导航其环境,这些轨迹优先考虑与查询的语义相似性以及对环境未探索区域的探索。 为了评估轨迹,VISTA引入了一种新颖且高效的视角-语义覆盖度量标准,该标准量化了3D场景中的几何视图多样性和任务相关性。 在静态数据集上,我们的覆盖度量标准在计算速度和重建质量方面优于最先进的基线方法FisherRF和Bayes' Rays。 在四旋翼硬件实验中,与基线方法相比,VISTA在具有挑战性的地图中实现了6倍更高的成功率,而在较不具挑战性的地图中则保持了基线性能。 最后,我们通过在四旋翼无人机和Spot四足机器人上部署VISTA证明了其平台无关性。 论文被接受后将发布开源代码。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.