图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

Beyond Skip Connections: Top-Down Modulation for Object Detection

CVPR2017 under review

code :(coming soon)

可以结合 Feature Pyramid Networks for Object Detection 阅读

大牛 Jitendra Malik 竟然都去 Google Research 兼职,这样的大牛肯定不是为了钱,深度学习需要数据, 所以说深度学习尤其需要高校和公司的强强联合。

超级飞侠包警长出场会有一句口头禅:无论是大问题还是小问题,都在我掌控!

这里想说的是 不管大目标还是小目标,都可以用 Top-Down Modulation 检测出来!

图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

在目标检测算法中,我们为了兼顾大目标和小目标,目前主流方法是 用 skip connections 综合利用更多的卷积特征图信息。但是怎么利用还是有讲究的,一不小心就过拟合了。我们指出问题的重点在于:What we need is a selection/attention mechanism that selects the relevant features from lower convolutional layers.

系统示意图如下所示:

图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

这里我们对标准的 自下而上的前向 CNN网络加入一个自上而下 top-down 网络,使用 lateral connections 连接起来。modulation 通过这些 connections 选择合适的滤波器实现,top-down 网络负责整合信息。

Top-Down Modulation 网络基础模块

图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

注意这里的 L 和 T 模块 都是小的 ConvNets,可以简单到一层卷积网络,也可以复杂到 Residual [24] or Inception [46] 模块, which can vary from a single or a hierarchy of convolutional layers to more involved Residual [24] or Inception [46] blocks。

图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

注意这里的特征尺寸的放大。

实验结果:

图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

图像目标检测DET--Beyond Skip Connections: Top-Down Modulation for Object Detection

考虑到 Top-Down Modulation 这个模块网络结构的可变性,检测精度,时间,检测应用场景,网络结构等 都是相互关联。