当前位置: X-MOL 学术IEEE Trans. Pattern Anal. Mach. Intell. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

用于多方向目标检测的水平边界框上的滑动顶点

IEEE Transactions on Pattern Analysis and Machine Intelligence ( IF 20.8 ) Pub Date : 2020-02-18 , DOI: 10.1109/tpami.2020.2974745
Yongchao Xu , Mingtao Fu , Qimeng Wang , Yukang Wang , Kai Chen , Gui-Song Xia , Xiang Bai


物体检测最近取得了实质性进展。然而,广泛采用的水平边界框表示并不适合普遍存在的定向对象,例如航空图像和场景文本中的对象。在本文中,我们提出了一个简单而有效的框架来检测多方向对象。我们不是直接对四个顶点进行回归,而是在每个对应边上滑动水平边界框的顶点,以准确地描述多方向对象。具体来说,我们回归了四个长度比,表征了每个相应边上的相对滑动偏移。这可以促进偏移学习并避免定向对象的顺序标签点的混乱问题。为了进一步解决近水平物体的混淆问题,我们还引入了基于物体与其水平边界框之间的面积比的倾斜因子,指导每个物体选择水平或定向检测。我们将这五个额外的目标变量添加到 Faster R-CNN 的回归头中,这需要可忽略的额外计算时间。大量的实验结果表明,在没有花哨的情况下,所提出的方法在多个多方向目标检测基准上实现了优异的性能,包括航空图像中的目标检测、场景文本检测、鱼眼图像中的行人检测。




"点击查看英文标题和摘要"

更新日期:2020-02-18
down
wechat
bug