Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2503.00448

帮助 | 高级搜索

统计学 > 方法论

arXiv:2503.00448 (stat)
[提交于 2025年3月1日 ]

标题: 带有缺失值的参数MMD估计:对缺失性和数据模型误指定的鲁棒性

标题: Parametric MMD Estimation with Missing Values: Robustness to Missingness and Data Model Misspecification

Authors:Badr-Eddine Chérief-Abdellatif, Jeffrey Näf
摘要: 在缺失数据文献中,最大似然估计量(MLE)因其在随机缺失(MAR)数据下具有可忽略性而备受推崇。然而,即使在MAR假设下,它对(完全)数据模型的误设仍然存在显著局限性。此外,MAR假设并不总是现实的,这通过缺失机制引入了潜在误设的额外来源,使该问题更加复杂。为了解决这些问题,我们提出了一种基于最大均值差异(MMD)的新颖M估计方法,该方法在理论上被证明对模型误设和假设缺失机制的偏差都具有鲁棒性。我们的方法在复杂情况下提供了强有力理论保证和更高的可靠性。我们在完全随机缺失(MCAR)情况下建立了估计量的一致性和渐近正态性,提出了一个高效的随机梯度下降算法,并推导了误差界,明确分离了模型误设和缺失偏差的贡献。此外,我们分析了非随机缺失(MNAR)场景,在这些场景中,我们的估计量保持了可控的误差,包括缺失机制和数据模型都被污染的情况。我们的贡献细化了对MLE局限性的理解,并提供了一个处理缺失数据的稳健且有原则的替代方案。
摘要: In the missing data literature, the Maximum Likelihood Estimator (MLE) is celebrated for its ignorability property under missing at random (MAR) data. However, its sensitivity to misspecification of the (complete) data model, even under MAR, remains a significant limitation. This issue is further exacerbated by the fact that the MAR assumption may not always be realistic, introducing an additional source of potential misspecification through the missingness mechanism. To address this, we propose a novel M-estimation procedure based on the Maximum Mean Discrepancy (MMD), which is provably robust to both model misspecification and deviations from the assumed missingness mechanism. Our approach offers strong theoretical guarantees and improved reliability in complex settings. We establish the consistency and asymptotic normality of the estimator under missingness completely at random (MCAR), provide an efficient stochastic gradient descent algorithm, and derive error bounds that explicitly separate the contributions of model misspecification and missingness bias. Furthermore, we analyze missing not at random (MNAR) scenarios where our estimator maintains controlled error, including a Huber setting where both the missingness mechanism and the data model are contaminated. Our contributions refine the understanding of the limitations of the MLE and provide a robust and principled alternative for handling missing data.
主题: 方法论 (stat.ME)
引用方式: arXiv:2503.00448 [stat.ME]
  (或者 arXiv:2503.00448v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2503.00448
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Jeffrey Näf [查看电子邮件]
[v1] 星期六, 2025 年 3 月 1 日 10:59:17 UTC (802 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-03
切换浏览方式为:
stat

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号