当前位置: X-MOL 学术arXiv.cs.IR › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
RadGraph:从放射学报告中提取临床实体和关系
arXiv - CS - Information Retrieval Pub Date : 2021-06-28 , DOI: arxiv-2106.14463
Saahil Jain, Ashwin Agrawal, Adriel Saporta, Steven QH Truong, Du Nguyen Duong, Tan Bui, Pierre Chambon, Yuhao Zhang, Matthew P. Lungren, Andrew Y. Ng, Curtis P. Langlotz, Pranav Rajpurkar

从自由文本放射学报告中提取结构化临床信息可以将放射学报告信息用于各种关键的医疗保健应用程序。在我们的工作中,我们提出了 RadGraph,这是一个全文胸部 X 射线放射学报告中实体和关系的数据集,基于我们设计用于构建放射学报告的新型信息提取模式。我们发布了一个开发数据集,其中包含来自 MIMIC-CXR 数据集(14,579 个实体和 10,889 个关系)的 500 个放射科报告的委员会认证放射科医师注释,以及一个测试数据集,其中包含两组独立的委员会认证放射科医师注释,用于 100报告在 MIMIC-CXR 和 CheXpert 数据集上平均分配。使用这些数据集,我们训练和测试深度学习模型 RadGraph Benchmark,它实现了 0 的微 F1。在 MIMIC-CXR 和 CheXpert 测试集上的关系提取分别为 82 和 0.73。此外,我们发布了一个推理数据集,其中包含由 RadGraph Benchmark 自动生成的注释,其中包含 220,763 个 MIMIC-CXR 报告(约 600 万个实体和 400 万个关系)和 500 个 CheXpert 报告(13,783 个实体和 9,908 个关系),并映射到相关的胸片。我们免费提供的数据集可以促进广泛的医学自然语言处理研究,以及与胸片相关的计算机视觉和多模态学习。763 份 MIMIC-CXR 报告(约 600 万个实体和 400 万个关系)和 500 个 CheXpert 报告(13,783 个实体和 9,908 个关系),并映射到相关的胸片。我们免费提供的数据集可以促进广泛的医学自然语言处理研究,以及与胸片相关的计算机视觉和多模态学习。763 份 MIMIC-CXR 报告(约 600 万个实体和 400 万个关系)和 500 个 CheXpert 报告(13,783 个实体和 9,908 个关系),并映射到相关的胸片。我们免费提供的数据集可以促进广泛的医学自然语言处理研究,以及与胸片相关的计算机视觉和多模态学习。



"点击查看英文标题和摘要"

更新日期:2021-06-29
down
wechat
bug