Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > hep-ph > arXiv:2412.03673

帮助 | 高级搜索

高能物理 - 现象学

arXiv:2412.03673 (hep-ph)
[提交于 2024年12月4日 (v1) ,最后修订 2024年12月9日 (此版本, v2)]

标题: Transformer模型在喷注标记中的解释

标题: Interpreting Transformers for Jet Tagging

Authors:Aaron Wang, Abhijith Gandrakota, Jennifer Ngadiuba, Vivekanand Sahu, Priyansh Bhatnagar, Elham E Khoda, Javier Duarte
摘要: 机器学习(ML)算法,特别是基于注意力机制的变压器模型,已成为分析欧洲核子研究中心大型强子对撞机(CERN LHC)上的 ATLAS 和 CMS 等粒子物理实验产生的海量数据不可或缺的工具。 粒子变换器(ParT)是一种最先进的模型,利用粒子级注意力来改进喷注标记任务,这对于识别由质子碰撞产生的粒子至关重要。 本研究专注于通过分析注意力热图和粒子对在$\eta$-$\phi$平面上的关联来解读 ParT,揭示了一种二元注意力模式,其中每个粒子最多关注另一个粒子。 同时,我们观察到 ParT 根据衰变对重要粒子和子喷注的注意力有所不同,这表明该模型学会了传统的喷注子结构可观测量。 这些见解增强了我们对模型内部工作原理和学习过程的理解,为未来提高高能物理应用中的变压器架构效率提供了潜在途径。
摘要: Machine learning (ML) algorithms, particularly attention-based transformer models, have become indispensable for analyzing the vast data generated by particle physics experiments like ATLAS and CMS at the CERN LHC. Particle Transformer (ParT), a state-of-the-art model, leverages particle-level attention to improve jet-tagging tasks, which are critical for identifying particles resulting from proton collisions. This study focuses on interpreting ParT by analyzing attention heat maps and particle-pair correlations on the $\eta$-$\phi$ plane, revealing a binary attention pattern where each particle attends to at most one other particle. At the same time, we observe that ParT shows varying focus on important particles and subjets depending on decay, indicating that the model learns traditional jet substructure observables. These insights enhance our understanding of the model's internal workings and learning process, offering potential avenues for improving the efficiency of transformer architectures in future high-energy physics applications.
评论: 已被机器学习与物理科学研讨会(NeurIPS 2024)接受
主题: 高能物理 - 现象学 (hep-ph) ; 机器学习 (cs.LG); 高能物理 - 实验 (hep-ex); 数据分析、统计与概率 (physics.data-an)
引用方式: arXiv:2412.03673 [hep-ph]
  (或者 arXiv:2412.03673v2 [hep-ph] 对于此版本)
  https://doi.org/10.48550/arXiv.2412.03673
通过 DataCite 发表的 arXiv DOI
期刊参考: FERMILAB-CONF-24-0868-CMS-LDRD

提交历史

来自: Abhijith Gandrakota [查看电子邮件]
[v1] 星期三, 2024 年 12 月 4 日 19:06:40 UTC (508 KB)
[v2] 星期一, 2024 年 12 月 9 日 03:47:39 UTC (508 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
hep-ph
< 上一篇   |   下一篇 >
新的 | 最近的 | 2024-12
切换浏览方式为:
cs
cs.LG
hep-ex
physics
physics.data-an

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号