计算机科学 > 机器学习
[提交于 2025年6月2日
]
标题: MUDI:理解药效药物-药物相互作用的多模态生物医学数据集
标题: MUDI: A Multimodal Biomedical Dataset for Understanding Pharmacodynamic Drug-Drug Interactions
摘要: 理解不同药物之间的相互作用(药物-药物相互作用或DDI)对于确保患者安全和优化治疗效果至关重要。现有的DDI数据集主要关注文本信息,忽视了反映复杂药物机制的多模态数据。本文(1)介绍了MUDI,这是一个大规模的多模态生物医学数据集,用于理解药效学药物-药物相互作用,并(2)评估学习方法来研究它。简而言之,MUDI通过结合310,532个标注的药物对(标记为协同作用、拮抗作用或新效应)的药理学文本、化学公式、分子结构图和图像,提供了药物的全面多模态表示。关键的是,为了有效评估基于机器学习的泛化能力,MUDI测试集中包含未见过的药物对。我们使用晚期融合投票和中间融合策略评估基准模型。所有数据、注释、评估脚本和基线都以开放研究许可的形式发布。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.