Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > stat > arXiv:1206.6367

帮助 | 高级搜索

统计学 > 方法论

arXiv:1206.6367 (stat)
[提交于 2012年6月27日 ]

标题: 离散 Kolmogorov-Smirnov 统计量与欧几里得距离的比较

标题: A comparison of the discrete Kolmogorov-Smirnov statistic and the Euclidean distance

Authors:Jacob Carruth, Mark Tygert, Rachel Ward
摘要: 拟合优度检验用于衡量一组给定的观测值是否与从用户指定的概率分布(称为“模型”)中独立同分布(i.i.d.)抽取的结果一致(在预期的随机波动范围内)。标准的检验方法涉及模型与观察到的抽样经验分布之间的差异。一些差异度量是累积的,而另一些则不是。最流行的累积度量是 Kolmogorov-Smirnov 统计量;当所有考虑中的概率分布都是离散时,一个自然的非累积度量是模型与经验分布之间的欧几里得距离。本文通过数学分析及其对各种数据集的说明表明,当抽样的取值存在自然顺序(即数据为有序数据)时,Kolmogorov-Smirnov 统计量往往比欧几里得距离更强大;而在没有自然顺序(或部分顺序)的情况下(即数据为名义数据),欧几里得距离比 Kolmogorov-Smirnov 统计量更可靠且更容易理解。
摘要: Goodness-of-fit tests gauge whether a given set of observations is consistent (up to expected random fluctuations) with arising as independent and identically distributed (i.i.d.) draws from a user-specified probability distribution known as the "model." The standard gauges involve the discrepancy between the model and the empirical distribution of the observed draws. Some measures of discrepancy are cumulative; others are not. The most popular cumulative measure is the Kolmogorov-Smirnov statistic; when all probability distributions under consideration are discrete, a natural noncumulative measure is the Euclidean distance between the model and the empirical distributions. In the present paper, both mathematical analysis and its illustration via various data sets indicate that the Kolmogorov-Smirnov statistic tends to be more powerful than the Euclidean distance when there is a natural ordering for the values that the draws can take -- that is, when the data is ordinal -- whereas the Euclidean distance is more reliable and more easily understood than the Kolmogorov-Smirnov statistic when there is no natural ordering (or partial order) -- that is, when the data is nominal.
评论: 15页,6个图,3个表格
主题: 方法论 (stat.ME) ; 统计理论 (math.ST)
引用方式: arXiv:1206.6367 [stat.ME]
  (或者 arXiv:1206.6367v1 [stat.ME] 对于此版本)
  https://doi.org/10.48550/arXiv.1206.6367
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Mark Tygert [查看电子邮件]
[v1] 星期三, 2012 年 6 月 27 日 19:15:25 UTC (25 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
  • 其他格式
查看许可
当前浏览上下文:
stat.TH
< 上一篇   |   下一篇 >
新的 | 最近的 | 2012-06
切换浏览方式为:
math
math.ST
stat
stat.ME

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号