电气工程与系统科学 > 图像与视频处理
[提交于 2022年4月21日
]
标题: 病理学中评估人工智能解决方案的测试数据集建议
标题: Recommendations on test datasets for evaluating AI solutions in pathology
摘要: 自动从数字组织学图像中提取信息的人工智能(AI)解决方案在改善病理诊断方面显示出巨大潜力。在常规使用之前,评估其预测性能并获得监管批准非常重要。这种评估需要适当的测试数据集。然而,编制这样的数据集具有挑战性,并且缺乏具体的建议。一个由各种利益相关者组成的委员会,包括商业AI开发者、病理学家和研究人员,讨论了测试数据集的关键方面,并对病理学中的测试数据集进行了广泛的文献回顾。在这里,我们总结了结果并得出了关于测试数据集收集的一般建议。我们探讨了几个问题:需要哪些图像以及需要多少张?如何处理低患病率的子集?如何检测潜在的偏倚?数据集应该如何报告?不同国家的监管要求是什么?这些建议旨在帮助AI开发者展示其产品的实用性,并帮助监管机构和最终用户验证所报告的性能指标。为了制定足够有代表性的测试数据集的标准,从而在未来减少用户干预并更好地支持诊断工作流程,还需要进一步的研究。
当前浏览上下文:
physics.med-ph
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.