当前位置: X-MOL 学术Pattern Anal. Applic. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
TSRN:用于时间动作分割的两阶段细化网络
Pattern Analysis and Applications ( IF 3.7 ) Pub Date : 2023-05-15 , DOI: 10.1007/s10044-023-01166-8
Xiaoyan Tian , Ye Jin , Xianglong Tang

在高级视频语义理解中,连续动作分割是一项具有挑战性的任务,旨在分割未修剪的视频并随着时间的推移用预定义的标签标记每个片段。然而,片段预测的准确性受到视频序列中混淆信息的限制,例如动作边界期间的模糊帧或由于缺乏语义关系而导致的过度分割错误。在这项工作中,我们提出了一个两阶段细化网络 (TSRN) 来改进时间动作分割。我们首先使用新型变换器时间卷积网络中的多头自注意力机制捕获整个视频序列的全局关系,并在每个动作片段中建立时间关系模型。然后,我们引入了一个双注意力空间金字塔池网络来融合宏观和微观角度的特征,从初始预测中提供更准确的分类结果。此外,联合损失函数减轻了过度分割。与最先进的方法相比,所提出的 TSRN 显着改进了三个具有挑战性的数据集(即 50Salads、Georgia Tech Egocentric Activities 和 Breakfast)的时间动作分割。





"点击查看英文标题和摘要"

更新日期:2023-05-15
down
wechat
bug