统计学 > 方法论
[提交于 2025年7月19日
]
标题: 半参数加速失效时间模型中分层抽样设计的变量选择与聚类失效时间
标题: Variable Selection for Stratified Sampling Designs in Semiparametric Accelerated Failure Time Models with Clustered Failure Times
摘要: 在大规模流行病学研究中,由于分层抽样设计下的失效时间,统计推断常常受到高维协变量的复杂影响。 针对完整队列数据开发的变量选择方法并不能自然地扩展到分层抽样设计,因此需要对抽样方案进行适当的调整。 当失效时间存在聚类并且表现出组内相关性时,会带来进一步的挑战。 作为当比例风险假设不成立时Cox比例风险(PH)模型的替代方法,对于加速失效时间(AFT)模型的惩罚Buckley-James(BJ)估计方法可以通过结合广义估计方程(GEE)技术来处理这种情形中的组内相关性,尽管其实际实施仍受计算不稳定的阻碍。 我们提出了一种在GEE框架内的正则化估计方法,用于分层抽样设计,其理念类似于惩罚BJ方法,但具有可靠的推断过程。 我们建立了所提出估计量的一致性和渐近正态性,并证明它们实现了Oracle属性。 大量的模拟研究表明,我们的方法在忽略抽样偏差或组内相关性的现有方法中表现更优。 此外,正则化方案即使在中等样本量的情况下也能有效选择相关变量。 所提出的方法通过一个牙科研究的应用进行了说明。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.