高能物理 - 现象学
[提交于 2024年12月4日
(v1)
,最后修订 2024年12月9日 (此版本, v2)]
标题: Transformer模型在喷注标记中的解释
标题: Interpreting Transformers for Jet Tagging
摘要: 机器学习(ML)算法,特别是基于注意力机制的变压器模型,已成为分析欧洲核子研究中心大型强子对撞机(CERN LHC)上的 ATLAS 和 CMS 等粒子物理实验产生的海量数据不可或缺的工具。 粒子变换器(ParT)是一种最先进的模型,利用粒子级注意力来改进喷注标记任务,这对于识别由质子碰撞产生的粒子至关重要。 本研究专注于通过分析注意力热图和粒子对在$\eta$-$\phi$平面上的关联来解读 ParT,揭示了一种二元注意力模式,其中每个粒子最多关注另一个粒子。 同时,我们观察到 ParT 根据衰变对重要粒子和子喷注的注意力有所不同,这表明该模型学会了传统的喷注子结构可观测量。 这些见解增强了我们对模型内部工作原理和学习过程的理解,为未来提高高能物理应用中的变压器架构效率提供了潜在途径。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.