定量生物学 > 生物大分子
[提交于 2025年10月3日
]
标题: SAE-RNA:一种用于解释RNA语言模型表示的稀疏自编码器模型
标题: SAE-RNA: A Sparse Autoencoder Model for Interpreting RNA Language Model Representations
摘要: 深度学习,特别是大型语言模型的进步,已经改变了生物分子建模,蛋白质方面的进展(例如ESM)激发了新兴的RNA语言模型,如RiNALMo。 然而,这些RNA语言模型内部如何以及编码了关于信使RNA(mRNA)或非编码RNA(ncRNA)家族的什么信息仍然不清楚。 我们提出了SAE-RNA,这是一种可解释性模型,用于分析RiNALMo表示并将其映射到已知的人类水平生物特征。 我们的工作将RNA可解释性框架视为预训练嵌入中的概念发现,无需端到端重新训练,并提供了实用工具来探究RNA LM可能关于ncRNA家族编码的内容。 该模型可以扩展到RNA组之间的紧密比较,并支持关于之前未被识别的关系的假设生成。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.