计算机科学 > 机器学习
[提交于 2025年10月16日
]
标题: 编码器作为编辑器:代码驱动的可解释分子优化
标题: Coder as Editor: Code-driven Interpretable Molecular Optimization
摘要: 分子优化是药物发现中的核心任务,需要精确的结构推理和领域知识。 虽然大型语言模型(LLMs)在生成自然语言中的高层编辑意图方面表现出色,但它们在忠实执行这些修改方面往往存在困难,尤其是在处理非直观表示如SMILES时。 我们引入了MECo,这是一个通过将编辑操作转换为可执行代码来弥合理性与执行之间差距的框架。 MECo将LLMs的分子优化重新构造成一个级联框架:从分子和属性目标生成人类可理解的编辑意图,随后通过代码生成将这些意图转化为可执行的结构编辑。 我们的方法在重现从化学反应和目标特定化合物对中得出的真实编辑方面实现了超过98%的准确率。 在涵盖物理化学性质和靶点活性的下游优化基准测试中,MECo通过38-86个百分点的改进使一致性达到90%以上,并在保持结构相似性的同时,相较于基于SMILES的基线方法取得了更高的成功率。 通过将意图与执行对齐,MECo实现了一致、可控且可解释的分子设计,为药物发现中的高保真反馈循环和人机协作工作流程奠定了基础。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.