定量生物学 > 定量方法
[提交于 2025年10月2日
]
标题: 用于训练和基准测试H&E切片中乳腺癌分割的多中心数据集
标题: A Multicentric Dataset for Training and Benchmarking Breast Cancer Segmentation in H&E Slides
摘要: 全自动全幻灯片图像(WSIs)的语义分割,使用苏木精和伊红(H&E)染色,在乳腺癌的大规模基于人工智能的生物标志物分析中是必不可少的。 然而,现有的乳腺癌分割公共数据集缺乏支持模型泛化性和在异质患者队列中稳健生物标志物验证所需的形态多样性。 我们引入了BrEast cancEr hisTopathoLogy sEgmentation(BEETLE),一个用于H&E染色乳腺癌WSIs多类语义分割的数据集。 它包含来自三个合作临床中心和两个公共数据集的587个活检和切除样本,使用七种扫描仪数字化,并涵盖了所有分子亚型和组织学等级。 通过多样化的注释策略,我们收集了四个类别的注释——浸润性上皮、非浸润性上皮、坏死和其他——特别关注现有数据集中代表性不足的形态,如原位导管癌和分散的lobular肿瘤细胞。 该数据集的多样性和对乳腺癌自动化生物标志物定量迅速增长领域的相关性,确保了其高重用潜力。 最后,我们提供了一个精心整理的多中心外部评估集,以实现乳腺癌分割模型的标准基准测试。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.