keras训练cnn模型时loss为nan

2024-02-26 20:56•JavaScript•阅读 3583

keras训练cnn模型时loss为nan

1.首先记下来如何解决这个问题的：由于我代码中 model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['accuracy'])

即损失函数用的是categorical_crossentropy所以，在pycharm中双击shift键，寻找该函数，会出现keras.loss模块中有该函数，进入该函数后，

原函数为：

def categorical_crossentropy(y_true, y_pred):
return K.categorical_crossentropy(y_true, y_pred)
修改为：

def categorical_crossentropy(y_true, y_pred):
return K.categorical_crossentropy(y_true, y_pred+1e-5)

网上很多都是tensorflow的解决方案，找了好久好久才在一篇博客的启发下，想着去找这个损失函数。https://www.cnblogs.com/hutao722/p/9761387.html
2.另外是为什么会出现这种现象（当然还会有其他可能，这里只记下我这种问题出现的原因）
我这里是在计算损失函数时求log的时候遇到了log(0)则会导致nan

上一篇 »深度学习之Python 脚本训练keras mnist 数字识别模型
下一篇 »keras和tensorflow保存为可部署的pb格式