统计学 > 应用
[提交于 2012年11月6日
(v1)
,最后修订 2015年5月3日 (此版本, v3)]
标题: 分类模型的样本量规划
标题: Sample Size Planning for Classification Models
摘要: 在生物光谱学中,用于分类器训练和测试的适当标注且统计独立的样本(如患者、批次等)稀缺且昂贵。学习曲线展示了模型性能作为训练样本大小的函数,并可帮助确定训练良好分类器所需的样本量。然而,实际上仅仅构建一个良好的模型是不够的:其性能还必须得到验证。我们讨论了典型的少量样本情况下的学习曲线,每类样本数量为 5 至 25 个独立样本。尽管分类模型达到了可接受的性能,但由于测试样本量同样有限,随机测试不确定性可能会完全掩盖学习曲线。因此,我们确定了验证过程中需要的合理精度所对应的测试样本量,发现通常需要 75 至 100 个样本来测试一个良好但非完美的分类器。这样的数据集随后可以基于已实现的性能进行细化的样本量规划。我们还演示了如何计算必要的样本量以证明一种分类器优于另一种:这通常需要数百个统计独立的测试样本,甚至在理论上不可能实现。我们通过大约 2550 个单细胞拉曼光谱的数据集(五类:红细胞、白细胞以及三种肿瘤细胞系 BT-20、MCF-7 和 OCI-AML3)以及广泛的模拟实验进行了验证,这些模拟实验允许精确测定相关模型的实际性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.