Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:2507.15222

帮助 | 高级搜索

统计学 > 方法论

arXiv:2507.15222 (stat)
[提交于 2025年7月21日 ]

标题: 将非补偿性误认为补偿性IRT:估计技能和方差的分析

标题: Misspecifying non-compensatory as compensatory IRT: analysis of estimated skills and variance

Authors:Hiroshi Tamano, Hideitsu Hino, Daichi Mochihashi
摘要: 多维项目反应理论是一种统计测试理论,用于根据测试结果估计学习者的潜在技能和问题的难度水平。 文献中已经提出了补偿模型和非补偿模型。 先前的研究表明,当非补偿模型被错误指定为补偿模型时,会显著低估较高技能。 然而,这一现象背后的机制尚未完全阐明。 尚不清楚是否也会发生高估,并且关于估计参数的方差是否存在相关问题仍不明确。 在本文中,我们旨在通过理论方法全面理解高估和低估现象。 除了之前发现的技能低估之外,我们新发现技能高估发生在原点附近。 此外,我们研究了在考虑模型误设的情况下,估计参数的渐近方差与未考虑模型误设时的差异程度。
摘要: Multidimensional item response theory is a statistical test theory used to estimate the latent skills of learners and the difficulty levels of problems based on test results. Both compensatory and non-compensatory models have been proposed in the literature. Previous studies have revealed the substantial underestimation of higher skills when the non-compensatory model is misspecified as the compensatory model. However, the underlying mechanism behind this phenomenon has not been fully elucidated. It remains unclear whether overestimation also occurs and whether issues arise regarding the variance of the estimated parameters. In this paper, we aim to provide a comprehensive understanding of both underestimation and overestimation through a theoretical approach. In addition to the previously identified underestimation of the skills, we newly discover that the overestimation of skills occurs around the origin. Furthermore, we investigate the extent to which the asymptotic variance of the estimated parameters differs when considering model misspecification compared to when it is not taken into account.
主题: 方法论 (stat.ME) ; 机器学习 (cs.LG); 机器学习 (stat.ML)
引用方式: arXiv:2507.15222 [stat.ME]
  (或者 arXiv:2507.15222v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.15222
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Hiroshi Tamano [查看电子邮件]
[v1] 星期一, 2025 年 7 月 21 日 03:52:09 UTC (687 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.ME
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.LG
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号