计算机科学 > 计算机视觉与模式识别
[提交于 2024年11月1日
]
标题: 基于车载3D激光雷达的深度学习在几何和语义场景理解中的应用
标题: On Deep Learning for Geometric and Semantic Scene Understanding Using On-Vehicle 3D LiDAR
摘要: 3D LiDAR点云数据对于计算机视觉、机器人和自动驾驶中的场景感知至关重要。 几何和语义场景理解,涉及3D点云,对于推动自动驾驶技术的发展至关重要。 然而,仍然存在重大挑战,特别是在提高系统的整体准确性(例如,分割准确性、深度估计准确性等)和效率方面。 为了解决与基于LiDAR的任务相关的准确性挑战,我们提出了DurLAR,这是首个高保真128通道3D LiDAR数据集,具有全景环境(近红外)和反射率图像。 为了在确保准确性的前提下提高3D分割的效率,我们提出了一种新的流程,该流程采用更小的架构,在需要更少真实标注的情况下,相比现有方法实现了更优的分割准确性。 为了提高分割准确性,我们引入了范围感知点对距离分布(RAPiD)特征和相关的RAPiD-Seg架构。 所有贡献已被同行评审会议接受,突显了在自动驾驶中3D LiDAR应用的准确性和效率方面的进展。 完整摘要:https://etheses.dur.ac.uk/15738/。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.