Win10+GTX906M+Tensorflow-gpu==2.1.0

  • Windows10
  • GeForce GTX 960M
  • python 3.7.6
  • tensorflow-gpu==2.1.0
  • CUDA 10.2
  • cuDNN v7.9.4.38 for windows10 CUDA10.1(截至到2020-02-21,cuDNN并未发布CUDA v10.2对应的版本)

安装Python

从Python官网下载对应的python版本,我这里选择的是Python 3.7.6。下载完之后就是“下一步”的时间了。

安装tensorflow-gpu

安装完python之后,打开powershell,执行命令:

pip3 install tensorflow-gpu

执行完成后,GPU版的tensorflow就安装完成了,CPU版的执行命令pip3 install tensorflow即可。

安装CUDA 10.2

注意,下载CUDA和cuDNN时,需要注册NVIDA账号。

这里下载Win10对应的v10.2版CUDA。下载完成后就又到了“下一步”的时间了。

安装cuDNN

这里下载,windows10系统对应的cuDNN,解压下载后的文件,将其中binincludelib文件夹复制到安装了CUDA10.2的路径中,替换掉原来的目录,我这里CUDA10.2的安装目录是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2

之后需要添加环境变量,将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\binC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\includeC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64添加到系统的环境变量中。

测试

打开ipython,输入以下内容:

import tensorflow as tf

tf.test.is_gpu_avaolable()

True

注意,此时会报错,“cudart64_101.dll not found”,没关系,找到“cudart64_102.dll”,重命名为“cudart64_101.dll”即可。