当前位置:
X-MOL 学术
›
Int. J. Appl. Earth Obs. Geoinf.
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
PolSAR image classification using complex-valued multiscale attention vision transformer (CV-MsAtViT)
International Journal of Applied Earth Observation and Geoinformation ( IF 7.6 ) Pub Date : 2025-02-18 , DOI: 10.1016/j.jag.2025.104412
Mohammed Q. Alkhatib
International Journal of Applied Earth Observation and Geoinformation ( IF 7.6 ) Pub Date : 2025-02-18 , DOI: 10.1016/j.jag.2025.104412
Mohammed Q. Alkhatib
This paper Introduces a novel method for Polarimetric Synthetic Aperture Radar (PolSAR) image classification using a Complex-Valued Multiscale Attention Vision Transformer (CV-MsAtViT). The model incorporates a complex-valued multiscale feature fusion mechanism, a complex-valued attention block, and a Complex-Valued Vision Transformer (CV-ViT) to effectively capture spatial and polarimetric features from PolSAR data. The multiscale fusion block enhances feature extraction, while the attention mechanism prioritizes critical features, and the CV-ViT processes data in the complex domain, preserving both amplitude and phase information. Experimental results on benchmark PolSAR datasets, including Flevoland, San Francisco, and Oberpfaffenhofen, show that CV-MsAtViT achieves superior classification accuracy, with an overall accuracy (OA) of 98.35% on the Flevoland dataset, outperforming state-of-the-art models like PolSARFormer. The model also demonstrates efficient computational performance, minimizing the number of parameters while preserving high accuracy. These results confirm that CV-MsAtViT effectively enhances the classification of PolSAR images by leveraging complex-valued data processing, offering a promising direction for future advancements in remote sensing and complex-valued deep learning.
中文翻译:
基于复值多尺度注意力视觉转换器的 PolSAR 图像分类 (CV-MsAtViT)
该文介绍了一种使用复值多尺度注意力视觉转换器 (CV-MsAtViT) 进行极化合成孔径雷达 (PolSAR) 图像分类的新方法。该模型结合了复值多尺度特征融合机制、复值注意力块和复值视觉转换器 (CV-ViT),以有效地从 PolSAR 数据中捕获空间和极化特征。多尺度融合模块增强了特征提取,而注意力机制优先考虑关键特征,CV-ViT 在复杂域中处理数据,同时保留了幅度和相位信息。在基准 PolSAR 数据集(包括 Flevoland、San Francisco 和 Oberpfaffenhofen)上的实验结果表明,CV-MsAtViT 实现了卓越的分类精度,在 Flevoland 数据集上的总体准确率 (OA) 为 98.35%,优于 PolSARFormer 等最先进的模型。该模型还展示了高效的计算性能,在保持高精度的同时最大限度地减少了参数数量。这些结果证实了 CV-MsAtViT 通过利用复值数据处理有效地增强了 PolSAR 图像的分类,为遥感和复值深度学习的未来发展提供了有希望的方向。
更新日期:2025-02-18
中文翻译:

基于复值多尺度注意力视觉转换器的 PolSAR 图像分类 (CV-MsAtViT)
该文介绍了一种使用复值多尺度注意力视觉转换器 (CV-MsAtViT) 进行极化合成孔径雷达 (PolSAR) 图像分类的新方法。该模型结合了复值多尺度特征融合机制、复值注意力块和复值视觉转换器 (CV-ViT),以有效地从 PolSAR 数据中捕获空间和极化特征。多尺度融合模块增强了特征提取,而注意力机制优先考虑关键特征,CV-ViT 在复杂域中处理数据,同时保留了幅度和相位信息。在基准 PolSAR 数据集(包括 Flevoland、San Francisco 和 Oberpfaffenhofen)上的实验结果表明,CV-MsAtViT 实现了卓越的分类精度,在 Flevoland 数据集上的总体准确率 (OA) 为 98.35%,优于 PolSARFormer 等最先进的模型。该模型还展示了高效的计算性能,在保持高精度的同时最大限度地减少了参数数量。这些结果证实了 CV-MsAtViT 通过利用复值数据处理有效地增强了 PolSAR 图像的分类,为遥感和复值深度学习的未来发展提供了有希望的方向。