计算机科学 > 机器学习
[提交于 2025年7月3日
]
标题: 用于药基因中变异效应预测的矩阵变分自编码器
标题: A Matrix Variational Auto-Encoder for Variant Effect Prediction in Pharmacogenes
摘要: 变异效应预测器(VEPs)旨在评估蛋白质变异的功能影响,传统上依赖于多序列比对(MSAs)。这种方法假设自然发生的变异是适应的,这一假设受到药物基因组学的挑战,其中一些药物基因经历了较低的进化压力。深度突变扫描(DMS)数据集提供了另一种方法,通过为变异提供定量适应性分数。在这项工作中,我们提出了一种基于变压器的矩阵变分自编码器(matVAE),具有结构化先验,并在33个对应的DMS数据集上评估其性能,这些数据集对应于ProteinGym基准中的26种药物靶标和ADME蛋白。我们的模型在MSAs上训练(matVAE-MSA)在DMS数据集上的零样本预测中优于最先进的DeepSequence模型,尽管使用的参数数量少一个数量级,并且在推理时需要更少的计算。我们还将matVAE-MSA与matENC-DMS进行了比较,这是一个在DMS数据上训练的容量相似的模型,发现后者在监督预测任务中表现更好。此外,将AlphaFold生成的结构整合到我们的变压器模型中进一步提高了性能,结果可与在MSAs上训练并微调的DeepSequence相媲美。这些发现突显了DMS数据集替代MSAs的潜力,而不会显著降低预测性能,激励进一步开发DMS数据集并探索它们之间的关系以增强变异效应预测。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.