pytorch 调参小结

  • learning rate 和keras的参数不一样
    • SGD的在0.5左右
    • Adam的在0.01左右
  • 训练数据一定要打乱 测试数据不用打乱