Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2510.00432

帮助 | 高级搜索

统计学 > 方法论

arXiv:2510.00432 (stat)
[提交于 2025年10月1日 ]

标题: 经验部分贝叶斯两样本检验

标题: Empirical partially Bayes two sample testing

Authors:Wanyi Ling, Wufang Hong, Nikolaos Ignatiadis
摘要: 在高通量生物学中,一个常见的任务是测试成千上万种特征(例如,基因或蛋白质)在两个样本之间的均值差异,通常每个样本只有少量的重复。 稳健t检验通过假设正态性和相等方差来处理这个问题,并应用经验部分贝叶斯原理:为干扰参数(方差)提出并估计先验分布,但不为主要参数(均值)提出先验分布。 这种方法在基因组学中非常成功,但在实践中相等方差假设经常被违反。 同时,在少量重复的情况下,韦尔奇的不等方差t检验会受到类型I错误膨胀和功效低下的影响。 受稳健t检验的启发,我们将经验部分贝叶斯范式扩展到不等方差的两样本检验。 我们开发了两种方法:一种是建模两个样本特定方差的比率,另一种是联合建模两个方差,先验分布通过非参数最大似然估计。 我们的经验部分贝叶斯方法产生的p值在特征数量增加而重复数量保持固定时,渐近上是均匀的,确保渐近类型I错误控制。 模拟和对基因组数据的应用展示了功效的显著提升。
摘要: A common task in high-throughput biology is to test for differences in means between two samples across thousands of features (e.g., genes or proteins), often with only a handful of replicates per sample. Moderated t-tests handle this problem by assuming normality and equal variances, and by applying the empirical partially Bayes principle: a prior is posited and estimated for the nuisance parameters (variances) but not for the primary parameters (means). This approach has been highly successful in genomics, yet the equal variance assumption is often violated in practice. Meanwhile, Welch's unequal variance t-test with few replicates suffers from inflated type-I error and low power. Taking inspiration from moderated t-tests, we extend the empirical partially Bayes paradigm to two-sample testing with unequal variances. We develop two procedures: one that models the ratio of the two sample-specific variances and another that models the two variances jointly, with prior distributions estimated by nonparametric maximum likelihood. Our empirical partially Bayes methods yield p-values that are asymptotically uniform as the number of features grows while the number of replicates remains fixed, ensuring asymptotic type-I error control. Simulations and applications to genomic data demonstrate substantial gains in power.
主题: 方法论 (stat.ME)
引用方式: arXiv:2510.00432 [stat.ME]
  (或者 arXiv:2510.00432v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.00432
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Wanyi Ling [查看电子邮件]
[v1] 星期三, 2025 年 10 月 1 日 02:25:25 UTC (4,723 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号