当前位置: X-MOL 学术J. Supercomput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
DBT:基于双分支Transformer的多模态情感识别
The Journal of Supercomputing ( IF 2.5 ) Pub Date : 2022-12-21 , DOI: 10.1007/s11227-022-05001-5
Yufan Yi , Yan Tian , Cong He , Yajing Fan , Xinli Hu , Yiping Xu

语音情感识别中很少有带标签的数据集。原因是情感是主观的,需要标注专家花费大量时间来识别情感类别,而wav2vec2.0模型是通过自监督训练获得语音表征的通用模型。因此,我们尝试将其应用于语音情感识别任务。我们提出了一个多模式双分支变压器网络。对于语音处理分支,首先,我们使用wav2vec2.0提取语音特征。然后,使用微调策略和基于自注意力的层间特征融合策略。其次,全卷积分类网络用于情感分类。然后,我们使用 RoBERTa 通过改进的加权 Dempster-Shafer (DS) 策略进行文本情感识别和双峰融合。此外,我们提出了一种精度加权标签平滑方法,可以提高识别精度。我们在两个基准上进行综合实验:IEMOCAP 和 CASIA,涵盖中文和英文数据集。实验结果表明,所提出的方法比最先进的方法具有更高的准确性。





"点击查看英文标题和摘要"

更新日期:2022-12-22
down
wechat
bug