定量生物学 > 定量方法
[提交于 2019年4月2日
]
标题: 基于自然语言处理的癌症相关电子健康记录注释的框架语义概述
标题: A frame semantic overview of NLP-based information extraction for cancer-related EHR notes
摘要: 目标:电子健康记录(EHR)笔记中有关癌症的信息很多,如果能够使用自然语言处理(NLP)方法提取和结构化这些信息,将对生物医学研究有帮助。在本文中,我们对现有的临床NLP文献进行了范围综述,以针对癌症进行研究。方法:我们从PubMed、Google Scholar、ACL Anthology和现有综述中识别出描述从EHR来源提取特定癌症相关信息的NLP方法的研究。本研究使用了两个排除标准。我们排除了提取技术过于宽泛无法表示为框架的文章,以及使用了非常低级的提取方法的文章。最终共纳入79篇论文。我们根据框架语义原则组织这些信息,以帮助识别共同的重叠领域和潜在的空白。结果:从所审查的关于癌症信息的论文中创建了框架,如癌症诊断、肿瘤描述、癌症手术、乳腺癌诊断、前列腺癌诊断和前列腺癌患者的疼痛。这些框架包括定义以及具体的框架元素(即可提取属性)。我们发现癌症诊断是所审查论文中最常见的框架(79篇中的36篇),近期的研究重点是提取与治疗和乳腺癌诊断相关的信息。结论:本文描述的常见框架列表识别了现有NLP技术提取的重要癌症相关信息,并作为未来需要从EHR笔记中提取癌症信息的研究人员的有用资源。由于癌症NLP系统的大量重复,我们认为一个注释癌症框架及其相应NLP工具的通用资源将是有价值的。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.