Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
分析发现医学图像中 CNN 和 ViT 架构的起源
Scientific Reports ( IF 3.8 ) Pub Date : 2024-04-16 , DOI: 10.1038/s41598-024-58382-3
Seungmin Oh 1 , Namkug Kim 2 , Jongbin Ryu 1, 3
Affiliation
|
在本文中,我们深入介绍了医学图像中的 CNN 和 ViT 架构的分析,旨在为后续研究方向提供见解。特别是,深度神经网络的起源对于医学图像来说应该是可解释的,但在深度神经网络架构方面对这种可解释性的研究却很少。因此,我们研究模型性能的起源,这是解释深度神经网络的线索,重点关注两个最相关的架构,例如 CNN 和 ViT。我们给出了四种分析,包括(1)噪声环境中的鲁棒性,(2)平移不变性的一致性,(3)遮挡图像的视觉识别,以及(4)从形状或纹理中获取特征,以便我们比较 CNN 的起源和ViT导致视觉识别性能的差异。此外,还探讨了此类分析中医学图像和通用图像之间的差异。我们发现,与一般图像不同,医学图像表现出类别敏感。最后,我们根据我们的分析提出了一种简单的集成方法,证明我们的发现可以帮助建立后续研究。我们的分析代码将公开。

"点击查看英文标题和摘要"