定量生物学 > 定量方法
[提交于 2025年10月18日
]
标题: 基于大型语言模型的SNP变异和心电图表型的少标签多模态建模用于心血管风险分层
标题: Few-Label Multimodal Modeling of SNP Variants and ECG Phenotypes Using Large Language Models for Cardiovascular Risk Stratification
摘要: 心血管疾病(CVD)风险分层仍然是一项重大挑战,这是由于其多因素性质以及高质量标注数据集的可用性有限。 虽然基因组和电生理数据如SNP变异和ECG表型日益可获取,但在低标签设置中有效整合这些模态并不容易。 这一挑战源于缺乏良好注释的多模态数据集以及生物信号的高维度,这限制了传统监督模型的有效性。 为了解决这个问题,我们提出了一种少标签多模态框架,利用大语言模型(LLMs)结合遗传和电生理信息进行心血管风险分层。 我们的方法结合了一种伪标签精炼策略,以自适应地从弱监督预测中提炼出高置信度标签,从而仅使用少量真实注释就能实现稳健的模型微调。 为了增强可解释性,我们将任务框架化为一个思维链(CoT)推理问题,促使模型在生成预测的同时产生临床上相关的推理过程。 实验结果表明,多模态输入、少标签监督和CoT推理的结合提高了在不同患者群体中的鲁棒性和泛化能力。 使用多模态SNP变异和ECG衍生特征的实验结果表明,其性能与在完整数据集上训练的模型相当,突显了基于LLM的少标签多模态建模在推进个性化心血管护理方面的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.