Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.14689

帮助 | 高级搜索

统计学 > 方法论

arXiv:2507.14689 (stat)
[提交于 2025年7月19日 ]

标题: 半参数加速失效时间模型中分层抽样设计的变量选择与聚类失效时间

标题: Variable Selection for Stratified Sampling Designs in Semiparametric Accelerated Failure Time Models with Clustered Failure Times

Authors:Ying Chen, Chuan-Fa Tang, Sy Han Chiou, Min Chen
摘要: 在大规模流行病学研究中,由于分层抽样设计下的失效时间,统计推断常常受到高维协变量的复杂影响。 针对完整队列数据开发的变量选择方法并不能自然地扩展到分层抽样设计,因此需要对抽样方案进行适当的调整。 当失效时间存在聚类并且表现出组内相关性时,会带来进一步的挑战。 作为当比例风险假设不成立时Cox比例风险(PH)模型的替代方法,对于加速失效时间(AFT)模型的惩罚Buckley-James(BJ)估计方法可以通过结合广义估计方程(GEE)技术来处理这种情形中的组内相关性,尽管其实际实施仍受计算不稳定的阻碍。 我们提出了一种在GEE框架内的正则化估计方法,用于分层抽样设计,其理念类似于惩罚BJ方法,但具有可靠的推断过程。 我们建立了所提出估计量的一致性和渐近正态性,并证明它们实现了Oracle属性。 大量的模拟研究表明,我们的方法在忽略抽样偏差或组内相关性的现有方法中表现更优。 此外,正则化方案即使在中等样本量的情况下也能有效选择相关变量。 所提出的方法通过一个牙科研究的应用进行了说明。
摘要: In large-scale epidemiological studies, statistical inference is often complicated by high-dimensional covariates under stratified sampling designs for failure times. Variable selection methods developed for full cohort data do not extend naturally to stratified sampling designs, and appropriate adjustments for the sampling scheme are necessary. Further challenges arise when the failure times are clustered and exhibit within-cluster dependence. As an alternative of Cox proportional hazards (PH) model when the PH assumption is not valid, the penalized Buckley-James (BJ) estimating method for accelerated failure time (AFT) models can potentially handle within-cluster correlation in such setting by incorporating generalized estimating equation (GEE) techniques, though its practical implementation remains hindered by computational instability. We propose a regularized estimating method within the GEE framework for stratified sampling designs, in the spirit of the penalized BJ method but with a reliable inference procedure. We establish the consistency and asymptotic normality of the proposed estimators and show that they achieve the oracle property. Extensive simulation studies demonstrate that our method outperforms existing methods that ignore sampling bias or within-cluster dependence. Moreover, the regularization scheme effectively selects relevant variables even with moderate sample sizes. The proposed methodology is illustrated through applications to a dental study.
主题: 方法论 (stat.ME)
引用方式: arXiv:2507.14689 [stat.ME]
  (或者 arXiv:2507.14689v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.14689
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Ying Chen [查看电子邮件]
[v1] 星期六, 2025 年 7 月 19 日 16:35:00 UTC (41 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号