计算机科学 > 计算机视觉与模式识别
[提交于 2025年6月3日
]
标题: RoadFormer:自动驾驶道路表面分类中的局部-全局特征融合
标题: RoadFormer : Local-Global Feature Fusion for Road Surface Classification in Autonomous Driving
摘要: 道路表面分类(RSC)的目的是利用路面特征来识别路面的粗糙度、干湿状态以及材料信息。 由于其能够有效提升道路安全和交通管理的能力,在近年来受到了广泛关注。 在自动驾驶中,准确的道路表面分类允许车辆更好地理解道路环境,调整驾驶策略,从而确保更安全高效的驾驶体验。 长期以来,基于视觉的道路表面分类一直受到青睐。 然而,现有的视觉分类方法忽视了对路面类型细粒度分类(如相似的路面纹理)的探索。 在这项工作中,我们提出了一种纯视觉的细粒度RSC方法,用于自动驾驶场景,通过卷积模块和Transformer模块的堆叠融合局部和全局特征信息。 我们进一步探索了局部和全局特征提取模块的堆叠策略,以找到最优的特征提取策略。 此外,由于细粒度任务也面临着类内差异较大而类间差异较小的挑战,我们提出了一个前景-背景模块(FBM),能够有效地提取路面的细粒度上下文特征,增强复杂路面的分类能力。 在包含一百万个样本的大规模路面数据集以及从该数据集中重新组织的简化数据集上进行的实验分别达到了92.52%和96.50%的Top-1分类准确率,相比最先进的方法提高了5.69%到12.84%。 这些结果表明,RoadFormer在RSC任务中优于现有方法,在提高自动驾驶系统中路面感知可靠性方面取得了显著进展。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.