统计学 > 方法论
[提交于 2025年10月8日
]
标题: 零膨胀贝叶斯多研究无限非负矩阵分解
标题: Zero-Inflated Bayesian Multi-Study Infinite Non-Negative Matrix Factorization
摘要: 理解饮食模式与健康结果之间的关联,例如癌症风险,对于制定公共卫生指南和设计未来的饮食干预措施至关重要。 然而,饮食摄入数据存在多个统计挑战:它们是高维的,通常稀疏且含有过多的零值,并且由于个体层面的协变量而表现出异质性。 非负矩阵分解(NMF)通常用于估计高维计数数据中的模式,但通常依赖泊松假设,并缺乏充分应对这些复杂性的灵活性。 此外,整合多个研究的数据,例如癌症风险的病例对照研究,需要能够在不同来源之间共享信息的同时保留研究特异性结构的模型。 在本文中,我们引入了一种新颖的贝叶斯NMF模型,该模型(i)联合建模多研究计数数据以实现跨研究的信息共享,(ii)包含一个混合成分以处理零膨胀问题,并(iii)利用灵活的贝叶斯非参数先验来描述由个体协变量引起的模式得分的异质性。 这种结构允许根据饮食特征对个体进行聚类,从而进行下游与健康结果的关联分析。 通过广泛的模拟研究,我们证明与现有的贝叶斯NMF方法相比,我们的模型显著提高了估计准确性。 我们进一步通过在饮食与上呼吸道和消化道癌症的多个病例对照研究中的应用,展示了其适用性,识别出具有营养意义的饮食模式。 一个实现我们方法的R包可在https://github.com/blhansen/ZIMultiStudyNMF获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.