统计学 > 方法论
[提交于 2025年10月1日
]
标题: DiffKnock:基于扩散的神经网络推断敲诈统计量
标题: DiffKnock: Diffusion-based Knockoff Statistics for Neural Networks Inference
摘要: 我们引入了DiffKnock,一种基于扩散的敲除框架,用于高维特征选择,并具有有限样本错误发现率(FDR)控制。 DiffKnock解决了现有敲除方法的两个关键限制:保留复杂的特征依赖关系和检测非线性关联。 我们的方法训练扩散模型以生成有效的敲除样本,并使用基于神经网络的梯度和过滤器统计量来构建反对称特征重要性度量。 通过模拟,我们证明了DiffKnock在保持目标FDR的同时比基于自编码器的敲除方法具有更高的功效,表明其在涉及复杂非线性架构的场景中表现更优。 应用于LPS刺激的巨噬细胞小鼠单细胞RNA-seq数据,DiffKnock识别出经典的NF-$\kappa$B目标基因(Ccl3, Hmox1)和调节因子(Fosb, Pdgfb)。 这些结果表明,通过结合深度生成模型的灵活性与严格的统计保证,DiffKnock是一种强大且可靠的工具,可用于分析单细胞RNA-seq数据,以及其它领域中的高维和结构化数据。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.