当前位置:
X-MOL 学术
›
IEEE Trans. Multimedia
›
论文详情
Our official English website, www.x-mol.net, welcomes your
feedback! (Note: you will need to create a separate account there.)
用于人体解析的质量感知网络
IEEE Transactions on Multimedia ( IF 8.4 ) Pub Date : 12-2-2022 , DOI: 10.1109/tmm.2022.3217413 Lu Yang 1 , Qing Song 1 , Zhihui Wang 1 , Zhiwei Liu 2 , Songcen Xu 3 , Zhihao Li 3
Affiliation
如何估计网络输出的质量是一个重要问题,目前在人体解析领域还没有有效的解决方案。为了解决这个问题,本工作提出了一种基于输出概率图的统计方法来计算像素分类质量,称为像素得分。此外,提出了质量感知模块(QAM)来融合不同的质量信息,其目的是估计人类解析结果的质量。我们将 QAM 与简洁有效的网络设计相结合,提出用于人类解析的质量感知网络(QANet)。受益于 QAM 和 QANet 的优势,我们在 CIHP、MHP-v2、Pascal-Person-Part、ATR 和 LIP 等三个多重和一个单一人类解析基准上取得了最佳性能。在不增加训练和推理时间的情况下,QAM 在多人解析任务中将 APr^\text{r} 标准提高了 10 个以上。 QAM 可以扩展到具有良好质量估计的其他任务,例如实例分割。具体来说,QAM 在 COCO 和 LVISv1.0 数据集上通过 ∼\scriptstyle \sim1% mAP 改进了 Mask R-CNN。基于所提出的 QAM 和 QANet,我们的整个系统在 CVPR2021 L2ID 高分辨率人体解析(HRHP)挑战赛中获得第一名,在 CVPR2021 PIC 短视频人脸解析(SFP)挑战赛中获得第二名。代码和模型可在 https://github.com/soeaver/QANet 获取。
"点击查看英文标题和摘要"