tensorflow

2023-12-20 15:26•HTML/CSS•阅读 752

tf.nn.max_pool(value, ksize, strides, padding, name=None)

参数是四个，和卷积很类似：

第一个参数value：需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

第二个参数ksize：池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'

返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)

input 指需要做卷积的输入图像,Tensor

[batch, in_height, in_width, in_channels]--->[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]

float32/float64

filter：相当于CNN中的卷积核，Tensor

[filter_height, filter_width, in_channels, out_channels]--->[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]

要求类型与参数input相同，有一个地方需要注意，第三维in_channels，就是参数input的第四维

strides：卷积时在图像每一维的步长，一维的向量，长度4

padding：string类型的量，只能是"SAME","VALID"其中之一，这个值决定了不同的卷积方式

use_cudnn_on_gpu:bool类型，是否使用cudnn加速，默认为true

结果返回一个Tensor，这个输出，就是我们常说的feature map