计算机科学 > 机器学习
[提交于 2020年3月11日
(v1)
,最后修订 2021年2月24日 (此版本, v2)]
标题: 面向CRISP-ML(Q):一种具有质量保证方法的机器学习过程模型
标题: Towards CRISP-ML(Q): A Machine Learning Process Model with Quality Assurance Methodology
摘要: 机器学习是工业界和学术界广泛使用的一项成熟技术,但目前仍缺乏一种标准的流程模型来提高机器学习应用的成功率和效率。 项目组织和机器学习从业者在整个机器学习应用生命周期中需要指导以满足业务期望。 因此,我们提出了一个用于开发机器学习应用的流程模型,该模型涵盖了从定义范围到维护已部署的机器学习应用的六个阶段。 第一阶段结合了业务理解和数据理解,因为数据的可用性往往会影响项目的可行性。 第六阶段涵盖了机器学习应用监控和维护的最新方法,因为在变化的环境中模型退化风险十分明显。 对于流程中的每个任务,我们提出了适合解决我们在机器学习开发中识别出的风险的质保方法。 该方法来源于实践经验和科学文献,并已被证明具有普遍性和稳定性。 该流程模型扩展了CRISP-DM,这是一个享有强大行业支持的数据挖掘流程模型,但未能解决特定于机器学习的任务。 我们的工作提出了一个针对机器学习应用的行业和应用中立的流程模型,重点关注质量保证的技术任务。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.