TensorFlow-GPU、Win10、m1050Ti、anaconda、VSCODE,新手排坑

直接放精简版的路线:

0,浏览tf官方网站的指南:https://www.tensorflow.org/install/install_windows

1,知道怎么部署anaconda最新版和vscode的连接

2,pip安装tf-gpu最新版

3,NVIDIA官网下载tf官方指南上对应的cuda版本(2018年3月,现在是cuda 9.0)

4,NVIDIA官网下载tf官方指南上对应的cudnn版本(2018年3月,现在是cudnn 7.0)

5,下载visual studio15.4(针对cuda9.0现在的版本,不能用最新的15.6,不然第7步会build failed)

6,安装cuda,打开cmd or powershell 输入nvcc -V,确认cuda已部署。在环境变量确认cuda(参考https://www.leiphone.com/news/201711/GCh0IBszXrxP1iHU.html)。

7,用VS2017编译cuda sample(参考https://www.leiphone.com/news/201711/GCh0IBszXrxP1iHU.html的“4.2. 使用VS和CUDA编译测试文件”)

8,anaconda prompt,新建一个tf的环境,除了安装tf-gpu以外,安装其他自己需要的库

(参考tf官网https://www.tensorflow.org/install/install_windows的“Installing with Anaconda”)

(第四步选gpu版tf)

9,在anaconda prompt里验证tf的可行性(参考tf官网的“Validate your installation”)

10,把tf安装目录放到环境变量里(可选,因为不确定是不是必须的)

11,vscode里选编译环境到新的tf目录下

12,vscode里尝试tf的验证程序,如果报错,请重启电脑。

坑:

1,vs版本太高不行

2,cuda cudnn版本太高也不行

3,conda install tensorflow-gpu出来的版本很低,不确定是否影响结果,我用的pip才装到1.6

4,pip要部署国内镜像。推荐校园网部署清华的,别部署阿里云。我用清华的下载速度6MB/s。

5,vs2017安装总是卡在graphic的一个什么东西上,如果同样安装卡在这里,重新安装,把安装内容选项里面的2个graph开头的内容勾去掉。

6,注意第4步,安装的cudnn即便是大版本号对了,也可能在更进一步的使用过程中报错,因为tf和cudnn兼容性的问题。截止3/27/2018,请使用cudnn v7.0.4