卷积神经网络,五:SGD、adagrad与RMSprop,梯度下降法总结