目标检测算法基础——04Two-stage核心组件

Two-stage核心组件

一、Two-stage的两个核心组件

  • CNN网络(主干网络)
  • RPN网络

二、CNN网络设计原则

  • 从简到繁再到简的卷积神经网络
  • 多尺度特征融合的网络
  • 更轻量级的CNN网络

三、RPN网络

目标检测算法基础——04Two-stage核心组件

  • 区域推荐(Anchor机制)
  • ROI Pooling
  • 分类和回归

区域推荐(Anchor机制)

目标检测算法基础——04Two-stage核心组件

假设当前的feature map的大小为[n, c, w, h],选择当前w*h大小的feature map上的每个点来作为一个锚点,也就是候选区域的中心点(称之为anchor),以每一个中心点来提取候选区域,候选区域通常会按照一定的比例去提取,对于Fast RCNN,有9个不同的尺度去提取,而对于整个w*h大小的feature map,我们会提取w*h*9个候选区域,然后通过真值对候选区域进行筛选,通过IOU来筛选候选区域,得到正样本(包含目标对象的区域)和负样本(不包含目标对象的区域),也就是如果真值和候选区域的重叠面积超过了0.7则为正样本,小于0.3为负样本,这里的0.7和0.3都是超参,可自行设定

ROI Pooling

  • 输入:特征图、rois(1x5x1x1)以及ROI参数
  • 输出:固定尺寸的feature map