计算机科学 > 机器学习
[提交于 2025年7月11日
]
标题: ToxBench:一个具有AB-FEP计算标签的人类雌激素受体α结合亲和力预测基准
标题: ToxBench: A Binding Affinity Prediction Benchmark with AB-FEP-Calculated Labels for Human Estrogen Receptor Alpha
摘要: 蛋白质-配体结合亲和力预测对于药物发现和毒性评估至关重要。 虽然机器学习(ML)有望实现快速且准确的预测,但其进展受到可靠数据可用性的限制。 相比之下,基于物理的方法,如绝对结合自由能扰动(AB-FEP),能够提供高精度,但对于高通量应用来说计算成本过高。 为了弥合这一差距,我们引入了ToxBench,这是首个针对机器学习开发的大规模AB-FEP数据集,专注于单一药学关键靶点,即人雌激素受体α(ER$\alpha$)。 ToxBench包含8,770个ER$\alpha$-配体复合结构,其结合自由能通过AB-FEP计算,并且子集已通过实验亲和力验证,RMSE为1.75 kcal/mol,同时还包括非重叠的配体分割以评估模型的泛化能力。 使用ToxBench,我们进一步对最先进的机器学习方法进行了基准测试,值得注意的是,我们提出的DualBind模型,该模型采用双损失框架来有效学习结合能量函数。 基准结果表明,DualBind表现出优越的性能,且机器学习在计算成本大幅降低的情况下具有近似AB-FEP的潜力。
当前浏览上下文:
q-bio
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.