定量生物学 > 定量方法
[提交于 2025年1月24日
]
标题: GraPPI:一种用于大规模蛋白质-蛋白质相互作用探索的检索-分割-求解图RAG框架
标题: GraPPI: A Retrieve-Divide-Solve GraphRAG Framework for Large-scale Protein-protein Interaction Exploration
摘要: 药物发现(DD)对维持和改善公共健康做出了巨大贡献。 假设抑制蛋白质错误折叠可以减缓疾病进展,研究人员专注于目标识别(Target ID)以寻找药物结合的蛋白质结构。 尽管大型语言模型(LLMs)和检索增强生成(RAG)框架加速了药物发现,但将模型整合到连贯的工作流程中仍然具有挑战性。 我们进行了一项用户研究,与药物发现研究人员一起确定LLMs和RAG在Target ID中的适用性。 我们发现了两个主要结果: 1)一个LLM应基于初始蛋白质和具有治疗影响的蛋白质候选物提供多个蛋白质-蛋白质相互作用(PPIs);2)该模型必须提供PPI及相关解释以更好地理解。 基于这些观察,我们确定了之前Target ID方法的三个局限性:1)语义模糊性,2)缺乏可解释性,3)检索单元过短。 为了解决这些问题,我们提出了GraPPI,一种基于大规模知识图谱(KG)的检索-分割-求解代理管道RAG框架,通过将整个PPI路径的分析分解为专注于PPI边分析的子任务,以支持大规模PPI信号通路探索,从而理解治疗影响。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.