空洞卷积，dilated convolution理解

2024-03-30 08:22•杂谈•阅读 1368

Dilated/Atrous Convolution(中文叫做空洞卷积或者膨胀卷积) 或者是 Convolution with holes 从字面上就很好理解，是在标准的 convolution map 里注入空洞，以此来增加 reception field。相比原来的正常convolution，dilated convolution 多了一个 hyper-parameter 称之为 dilation rate 指的是kernel的间隔数量(e.g. 正常的 convolution 是 dilatation rate 1)。

Standard Convolution with a 3 x 3 kernel (and padding)：

空洞卷积，dilated convolution理解

Dilated Convolution with a 3 x 3 kernel and dilation rate 2：

空洞卷积，dilated convolution理解

下面看一下dilated conv原始论文[4]中的示意图：

空洞卷积，dilated convolution理解

(a)图对应3x3的1-dilated conv，和普通的卷积操作一样

(b)图对应3x3的2-dilated conv，实际的卷积kernel size还是3x3，但是空洞为1，也就是对于一个7x7的图像patch，只有9个红色的点和3x3的kernel发生卷积操作，其余的点略过。也可以理解为kernel的size为7x7，但是只有图中的9个点的权重不为0，其余都为0。可以看到虽然kernel size只有3x3，但是这个卷积的感受野已经增大到了7x7（如果考虑到这个2-dilated conv的前一层是一个1-dilated conv的话，那么每个红点就是1-dilated的卷积输出，所以感受野为3x3，所以1-dilated和2-dilated合起来就能达到7x7的conv）

(c)图是4-dilated conv操作，同理跟在两个1-dilated和2-dilated conv的后面，能达到15x15的感受野。对比传统的conv操作，3层3x3的卷积加起来，stride为1的话，只能达到(kernel-1)*layer+1=7的感受野，也就是和层数layer成线性关系，而dilated conv的感受野是指数级的增长。

dilated的好处是不做pooling损失信息的情况下，加大了感受野，让每个卷积输出都包含较大范围的信息。

缺点： kernel 并不连续，会损失信息的连续性

上一篇 »深入理解JavaScript函数
下一篇 »empty函数PHP

空洞卷积，dilated convolution理解

相关推荐

自己理解的javascript 的对象和类理解

深入理解javascript系列

javascript深入理解js闭包

深入理解理解 JavaScript 的 async/await

tensorflow.python.framework.errors_impl.UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize,

深入理解 Java 垃圾回收机制 深入理解 Java 垃圾回收机制

CNN卷积神经网络总结

Caffe实战，十二：模型分类测试以及特征图和参数可视化示例

深入理解 Java 垃圾回收机制深入理解 Java 垃圾回收机制