Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > q-bio > arXiv:2501.15631

帮助 | 高级搜索

定量生物学 > 生物大分子

arXiv:2501.15631 (q-bio)
[提交于 2025年1月26日 ]

标题: BoKDiff:针对目标的3D分子生成的最优K扩散对齐

标题: BoKDiff: Best-of-K Diffusion Alignment for Target-Specific 3D Molecule Generation

Authors:Ali Khodabandeh Yalabadi, Mehdi Yazdani-Jahromi, Ozlem Ozmen Garibay
摘要: 基于结构的药物设计(SBDD)利用生物分子靶标的三维结构来指导新治疗剂的创建。 生成模型的最新进展,包括扩散模型和几何深度学习,在优化配体生成方面显示出前景。 然而,高质量蛋白质-配体复合数据的稀缺性以及生成的配体与靶标蛋白对齐的固有挑战限制了这些方法的有效性。 我们提出了BoKDiff,一种新颖的框架,通过结合多目标优化和最佳K对齐方法来增强配体生成。 建立在DecompDiff模型的基础上,BoKDiff生成多样化的候选物,并使用分子属性的加权评估(如QED、SA和对接分数)对其进行排序。 为了解决对齐问题,我们引入了一种方法,将生成的配体的质心重新定位到其对接姿态,从而实现准确的子组件提取。 此外,我们集成了最佳N(BoN)采样方法,该方法无需微调即可从多个生成的候选物中选择最优配体。 BoN取得了卓越的结果,QED值超过0.6,SA分数高于0.75,成功率达到35%以上,证明了其效率和实用性。 BoKDiff在CrossDocked2020数据集上取得了最先进的结果,包括-8.58的平均Vina对接分数和26%的分子生成成功率。 本研究首次将最佳K对齐和最佳N采样应用于SBDD,突显了它们在生成建模与实际药物发现需求之间架起桥梁的潜力。 代码可在https://github.com/khodabandeh-ali/BoKDiff.git获取。
摘要: Structure-based drug design (SBDD) leverages the 3D structure of biomolecular targets to guide the creation of new therapeutic agents. Recent advances in generative models, including diffusion models and geometric deep learning, have demonstrated promise in optimizing ligand generation. However, the scarcity of high-quality protein-ligand complex data and the inherent challenges in aligning generated ligands with target proteins limit the effectiveness of these methods. We propose BoKDiff, a novel framework that enhances ligand generation by combining multi-objective optimization and Best-of-K alignment methodologies. Built upon the DecompDiff model, BoKDiff generates diverse candidates and ranks them using a weighted evaluation of molecular properties such as QED, SA, and docking scores. To address alignment challenges, we introduce a method that relocates the center of mass of generated ligands to their docking poses, enabling accurate sub-component extraction. Additionally, we integrate a Best-of-N (BoN) sampling approach, which selects the optimal ligand from multiple generated candidates without requiring fine-tuning. BoN achieves exceptional results, with QED values exceeding 0.6, SA scores above 0.75, and a success rate surpassing 35%, demonstrating its efficiency and practicality. BoKDiff achieves state-of-the-art results on the CrossDocked2020 dataset, including a -8.58 average Vina docking score and a 26% success rate in molecule generation. This study is the first to apply Best-of-K alignment and Best-of-N sampling to SBDD, highlighting their potential to bridge generative modeling with practical drug discovery requirements. The code is provided at https://github.com/khodabandeh-ali/BoKDiff.git.
评论: 本文正在接受ISMB/ECCB 2025的审稿
主题: 生物大分子 (q-bio.BM) ; 机器学习 (cs.LG)
引用方式: arXiv:2501.15631 [q-bio.BM]
  (或者 arXiv:2501.15631v1 [q-bio.BM] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.15631
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Ali Khodabandeh Yalabadi Mr. [查看电子邮件]
[v1] 星期日, 2025 年 1 月 26 日 18:29:11 UTC (414 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
q-bio
q-bio.BM

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号