当前位置: X-MOL 学术IEEE Access › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

用于 YOLO 物体检测的全功能可配置加速器

IEEE Access ( IF 3.4 ) Pub Date : 2021-05-19 , DOI: 10.1109/access.2021.3081818
Daniel Pestana , Pedro R. Miranda , Joao D. Lopes , Rui P. Duarte , Mario P. Vestias , Horacio C. Neto , Jose T. De Sousa


目标检测和分类是计算机视觉的一项重要任务。 YOLO(You Look Only Once)是一种非常有效的检测和分类算法。我们考虑在嵌入式平台上实时运行 YOLO 的硬件架构。考虑到新版本的快速交付,为 YOLO 的每个新版本设计一个新的专用加速器是不可行的。这项工作的主要目标是设计一个可配置和可扩展的核心,用于创建基于 YOLO、针对嵌入式平台的特定对象检测和分类系统。该核心加速了所有算法步骤的执行,包括预处理、模型推理和后处理。它考虑了定点格式、线性化激活函数、批量归一化、折叠以及利用 CNN 处理中大部分可用并行性的硬件结构。所提出的内核配置为实时执行 YOLOv3-Tiny 和 YOLOv4-Tiny,集成到基于 RISC-V 的片上系统架构中,并在 UltraScale XCKU040 FPGA(现场可编程门阵列)中进行原型设计。该解决方案采用 16 位定点格式,分别为 YOLOv3-Tiny 和 YOLOv4-Tiny 实现了每秒 32 帧和 31 帧的性能。与之前的提案相比,它以更高的性能效率提高了帧速率。所提出的内核的性能、面积效率和可配置性使得能够在嵌入式系统上快速开发基于 YOLO 的实时目标检测器。




"点击查看英文标题和摘要"

更新日期:2021-05-19
down
wechat
bug