Python机器学习，七十四Keras 预处理数据

2023-12-09 18:18•linux•阅读 697

首先需要调整数据集的形状，让其包含图像的位深信息。

打印原始数据集的形状：

>>> print (X_train.shape)
(60000, 28, 28)

可以看到并没有包含图像的位深信息。

MNIST是灰度图像，位深为1，我们将数据集从形状(n，宽度，高度)转换为(n，位深，宽度，高度)。

if K.image_data_format() == 'channels_first':
    X_train = X_train.reshape(X_train.shape[0], 1, 28, 28)
    X_test = X_test.reshape(X_test.shape[0], 1, 28, 28)
    input_shape = (1, 28, 28)
else:
    X_train = X_train.reshape(X_train.shape[0], 28, 28, 1)
    X_test = X_test.reshape(X_test.shape[0], 28, 28, 1)
    input_shape = (28, 28, 1)

Keras的底层实现库可能是TensorFlow或Theano，它们对数据集的形状要求是不一样的，TensorFlow要求通道在前channels_first，Theano相反。此处，我们使用TensorFlow的格式。

重新打印X_train的形状:

print (X_train.shape)
# (60000, 1, 28, 28)

可以看到，形状已经变化了，包含了图像的位深信息。

接下来，输入数据预处理步骤是将数据类型转换为float32，并将数据值归一化到[0,1]范围内。

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

上一篇 »Python之sklearn数据预处理中fit，,transform
下一篇 »【506】NLP实战系列，三—— keras 读取及处理 IMDB 数据库 - McDelfino

Python机器学习，七十四Keras 预处理数据

相关推荐

使用Tensorflow搭建回归预测模型之二：数据准备与预处理

Python机器学习，七十六Keras 模型架构

c++ 预处理和多重替换

深度学习优秀文章 TensorFlow2.0，6：数据预处理中的Dataset

使用Tensorflow搭建回归预测模型之二：数据准备与预处理

『TensorFlow』SSD源码学习_其五：TFR数据读取&数据预处理

keras_5_数据预处理

Keras文本预处理详解