当前位置:
X-MOL 学术
›
IEEE Trans. Inform. Forensics Secur.
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
MFAE:用于域泛化人脸反欺骗的屏蔽频率自动编码器
IEEE Transactions on Information Forensics and Security ( IF 6.3 ) Pub Date : 2024-02-28 , DOI: 10.1109/tifs.2024.3371266
Tianyi Zheng 1 , Bo Li 2 , Shuang Wu 2 , Ben Wan 1 , Guodong Mu 2 , Shice Liu 2 , Shouhong Ding 2 , Jia Wang 1
Affiliation
泛化人脸反欺骗(FAS)最近引起了广泛关注。尽管许多现有方法在域内设置下表现良好,但模型在看不见的域中的性能并不令人满意。在本文中,我们将注意力转移到频域来寻求解决方案。具体来说,我们检查了 FAS 图像的不同频带分量的特征,并观察到该模型的跨域性能对低频特征非常敏感。为了减轻这种敏感性并提高模型在 FAS 跨域任务中的性能,我们提出了一种称为掩蔽频率自动编码器(MFAE)的新方法。 MFAE 随机屏蔽图像低频频谱上的一部分频率,然后根据所得嵌入重建图像。这种创新的掩模图像建模 (MIM) 策略可用作预训练视觉变换器 (ViT) 的自监督任务,这可以降低 ViT 编码器对域移位的敏感度。此外,我们在 MFAE 中添加了一个辅助内容正则化解码器,以鼓励编码器对低频特征不敏感。结果表明,该模型对低频特征不敏感,在广泛的公共数据集上表现良好,并且在跨域 FAS 任务中优于其他最先进的方法。

"点击查看英文标题和摘要"