当前位置: X-MOL 学术Eur. Radiol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

评估生成式预训练 Transformer-4 (GPT-4) 在标准化放射学报告方面的性能

European Radiology ( IF 4.7 ) Pub Date : 2023-11-08 , DOI: 10.1007/s00330-023-10384-x
Amir M Hasani 1 , Shiva Singh 2 , Aryan Zahergivar 2 , Beth Ryan 3 , Daniel Nethala 3 , Gabriela Bravomontenegro 3 , Neil Mendhiratta 3 , Mark Ball 3 , Faraz Farhadi 2 , Ashkan Malayeri 2
Affiliation  

 客观的


放射学报告是临床诊断和决策的重要组成部分。随着 GPT-4(生成式预训练 Transformer 4)等先进人工智能 (AI) 模型的出现,人们对评估其优化或生成放射学报告的潜力越来越感兴趣。本研究旨在比较放射科医生生成的放射学报告和 GPT-4 AI 生成的放射学报告的质量和内容。

 方法


该研究采用了比较研究设计,随机选择并分析了总共100份匿名放射学报告。每个报告均由 GPT-4 处理,从而生成相应的 AI 生成报告。利用定量和定性分析技术来评估两组报告之间的相似性和差异。

 结果


在大多数类别中,人工智能生成的报告的质量与放射科医生生成的报告相当。在清晰度 ( p = 0.027)、易于理解性 ( p = 0.023) 和结构 ( p = 0.050) 方面观察到显着差异,有利于人工智能生成的报告。 AI 生成的报告更加简洁,平均减少了 34.53 个单词和 174.22 个字符,但句子长度的变化更大。内容相似度较高,平均余弦相似度为 0.85,序列匹配器相似度为 0.52,BLEU 得分为 0.5008,BERTScore F1 为 0.8775。

 结论


这项概念验证研究的结果表明,GPT-4 可以成为生成标准化放射学报告的可靠工具,提供潜在的好处,例如提高效率、更好的通信以及简化数据提取和分析。然而,必须解决局限性和伦理影响,以确保该技术在临床实践中安全有效的实施。


临床相关性声明


这项研究的结果表明,先进的人工智能模型 GPT-4(生成式预训练 Transformer 4)有潜力为放射学报告的标准化和优化做出重大贡献,从而提高临床实践中的效率和沟通。

 要点


• 大语言模型生成的放射学报告与放射科医生生成的报告表现出高度的内容相似性和适度的结构相似性。


• 性能指标强调了单词选择和顺序的紧密匹配,以及人工智能和放射科医生生成的报告之间的高度语义相似性。


• 大语言模型展示了生成标准化放射学报告、提高临床环境中的效率和沟通的潜力。





"点击查看英文标题和摘要"

更新日期:2023-11-08
down
wechat
bug