Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2506.21486

帮助 | 高级搜索

计算机科学 > 计算机视觉与模式识别

arXiv:2506.21486 (cs)
[提交于 2025年6月26日 ]

标题: 面向可靠的空闲空间检测:对象检测的条件标记点过程

标题: Towards Reliable Detection of Empty Space: Conditional Marked Point Processes for Object Detection

Authors:Tobias J. Riedlinger, Kira Maag, Hanno Gottschalk
摘要: 深度神经网络在计算机视觉任务中,如边界框检测和语义分割,已经达到了最先进的水平。 目标检测器和分割模型会为预测分配置信度分数,反映模型在目标检测或像素级分类中的不确定性。 然而,这些置信度估计常常是不准确的,因为它们的架构和损失函数是针对任务性能进行优化的,而不是基于概率基础。 即使预测是校准良好的,目标检测器也无法量化检测到的边界框之外的不确定性,即模型不会对没有检测到目标的区域是否真正没有障碍物进行概率评估。 这在自动驾驶等应用中构成了安全风险,因为在空区域中的不确定性仍未被探索。 在本工作中,我们提出了一种基于空间统计的目标检测模型。 边界框数据匹配标记点过程的实现,该过程常用于描述作为边界框中心识别的空间点事件的概率发生,其中标记用于描述边界框的空间扩展和类别。 我们的统计框架实现了基于似然的训练,并提供了关于某个区域是否可行驶(即无物体)的明确置信度估计。 我们通过校准评估和性能评估来证明了我们方法的有效性。
摘要: Deep neural networks have set the state-of-the-art in computer vision tasks such as bounding box detection and semantic segmentation. Object detectors and segmentation models assign confidence scores to predictions, reflecting the model's uncertainty in object detection or pixel-wise classification. However, these confidence estimates are often miscalibrated, as their architectures and loss functions are tailored to task performance rather than probabilistic foundation. Even with well calibrated predictions, object detectors fail to quantify uncertainty outside detected bounding boxes, i.e., the model does not make a probability assessment of whether an area without detected objects is truly free of obstacles. This poses a safety risk in applications such as automated driving, where uncertainty in empty areas remains unexplored. In this work, we propose an object detection model grounded in spatial statistics. Bounding box data matches realizations of a marked point process, commonly used to describe the probabilistic occurrence of spatial point events identified as bounding box centers, where marks are used to describe the spatial extension of bounding boxes and classes. Our statistical framework enables a likelihood-based training and provides well-defined confidence estimates for whether a region is drivable, i.e., free of objects. We demonstrate the effectiveness of our method through calibration assessments and evaluation of performance.
评论: 15页,4图,3表
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG); 概率 (math.PR)
引用方式: arXiv:2506.21486 [cs.CV]
  (或者 arXiv:2506.21486v1 [cs.CV] 对于此版本)
  https://doi.org/10.48550/arXiv.2506.21486
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Tobias Riedlinger PhD [查看电子邮件]
[v1] 星期四, 2025 年 6 月 26 日 17:14:37 UTC (10,783 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-06
切换浏览方式为:
cs
cs.CV
math
math.PR

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号