当前位置:
首页
>
课题组新闻
>
【2023.04】实验室骆炎民老师指导研究生王友杰等撰写论文在顶刊《IEEE Transactions on Circuits and Systems for Video Technology》录用!
【2023.04】实验室骆炎民老师指导研究生王友杰等撰写论文在顶刊《IEEE Transactions on Circuits and Systems for Video Technology》录用!
发布时间:2023-04-01
实验室骆炎民老师指导研究生王友杰等撰写的论文UformPose: A U-Shaped Hierarchical Multi-Scale Keypoint-Aware Framework for Human Pose Estimation,在顶刊《IEEE Transactions on Circuits and Systems for Video Technology》发表。骆老师为通讯作者。
该文指出,人体姿态估计是计算机视觉领域一个基础但具有挑战性的任务。然而,在一些困难场景下,例如关键点不可见、遮挡以及小尺度人物的情况,依然未能得到很好的解决。该文提出了一种新颖的姿态估计框架,名为 UformPose,旨在缓解这些问题。UformPose 有两个核心设计:共享特征金字塔干(Shared Feature Pyramid Stem, SFPS)和 U 形分层多尺度关键点感知注意模块(U-shaped hierarchical Multi-scale Keypoint-aware Attention Module, U-MKAM)。SFPS 是一种带有共享机制的特征金字塔干,用于在初始阶段学习更强的低层次特征,而这种共享机制能够促进跨分辨率的共性学习。该文的 U-MKAM 通过逐层整合主干网络的各层特征表示,尝试生成高质量的高分辨率表示。更重要的是,该文利用注意力机制的灵活性进行关键点感知建模,显式地捕获并平衡关键点之间的依赖关系。该文通过在 COCO 数据集上的竞争性姿态估计结果,实证证明了该框架的有效性。此外,在 CrowdPose 数据集上的大量实验和视觉分析进一步表明该文的模型在拥挤场景中的鲁棒性。