Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > hep-ph > arXiv:2505.11438

帮助 | 高级搜索

高能物理 - 现象学

arXiv:2505.11438 (hep-ph)
[提交于 2025年5月16日 ]

标题: 推断相关联的分布:助推顶喷流

标题: Inferring correlated distributions: boosted top jets

Authors:Ezequiel Alvarez, Manuel Szewc, Alejandro Szynkman, Santiago Tanco, Tatiana Tarutina
摘要: 改善对信号区信号和背景分布的理解是提升对撞物理中任何分析质量的关键所在。 这通常是一项艰巨的任务,因为——除其他原因外——信号与背景在信号区内难以区分,模拟可能达到可靠性极限,如果它们需要建模非微扰 QCD 的话,并且分布在多维空间中,很多时候各维度之间可能存在相关性。 贝叶斯密度估计是一种利用先验知识和数据关联来有效提取信号区数据信息的技术。 在这项工作中,我们将之前关于 collider 物理中有意义的无监督信号提取的数据驱动混合模型研究进一步扩展,以纳入特征之间的相关性。 使用 top 和 QCD 喷注的标准数据集,我们展示了尽管模拟器存在预期偏差,但可以通过它们向推理模型注入足够的归纳细微差别(特别是在先验方面),然后由数据进行修正并估算各类别内特征间的真正相关分布。 我们将带相关性和不带相关性的模型进行对比,以展示信号提取对相关性加入的敏感程度,并通过监督和无监督指标量化相关性加入带来的改进。
摘要: Improving the understanding of signal and background distributions in signal-region is a valuable key to enhance any analysis in collider physics. This is usually a difficult task because -- among others -- signal and backgrounds are hard to discriminate in signal-region, simulations may reach a limit of reliability if they need to model non-perturbative QCD, and distributions are multi-dimensional and many times may be correlated within each class. Bayesian density estimation is a technique that leverages prior knowledge and data correlations to effectively extract information from data in signal-region. In this work we extend previous works on data-driven mixture models for meaningful unsupervised signal extraction in collider physics to incorporate correlations between features. Using a standard dataset of top and QCD jets, we show how simulators, despite having an expected bias, can be used to inject sufficient inductive nuance into an inference model in terms of priors to then be corrected by data and estimate the true correlated distributions between features within each class. We compare the model with and without correlations to show how the signal extraction is sensitive to their inclusion and we quantify the improvement due to the inclusion of correlations using both supervised and unsupervised metrics.
评论: 25页,12幅图,2个表格
主题: 高能物理 - 现象学 (hep-ph) ; 高能物理 - 实验 (hep-ex)
引用方式: arXiv:2505.11438 [hep-ph]
  (或者 arXiv:2505.11438v1 [hep-ph] 对于此版本)
  https://doi.org/10.48550/arXiv.2505.11438
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Tatiana Tarutina [查看电子邮件]
[v1] 星期五, 2025 年 5 月 16 日 16:57:42 UTC (2,924 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
hep-ph
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-05
切换浏览方式为:
hep-ex

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号