win10配置CUDA+Tensorflow2.0的一些经验

目录

问题描述

网上已经很多关于配置CUDA的文章,自己这篇文章的重点是安装和配置的一些细节,而至于具体的步骤(比如软件怎么下,环境变量怎么配等)请自行搜索,我相信大家也不会只参考一篇文章,如有指正或疑问请评论留言,谢谢!

  1. 安装VC_redist.x64.exe,VS2015附属组件
  2. 安装 tensorflow-cpu
  3. 安装 tensorflow-gpu-2.0,并配置 CUDA
  4. 编译 Nvidia Samples
  5. 环境:Win10;GPU--Nvidia 940MX

安装VC环境

这里如果不提前安装这个的话,在后面使用import tensorflow会遇到DLL无法找到对应模块这个问题。

安装后建议重启。同样的,下面涉及到修改环境变量等步骤如果验证失败,不一定是配置错了,说不准重启生效。这样能节约大量搜索解决方案的时间。

安装 tensorflow-cpu-2.0

  1. 安装 anaconda
    • 如果认为 anaconda 较大,可安装 miniconda;
    • win10 下需要特别注意环境变量的配置
  2. 激活 conda 环境
    • 建议新建一个环境,如 conda create -n env_name python=3.7
    • 新环境的 python 版本和要安装的 tensorflow 的版本是相关的,所以如果要安装最新版的 tensorflow-2.0,需要使用 python3.7 及以上。
    • pip 的更新和换源自行搜索即可。Linux 的 pip 更新见自己的另一篇文章。
  3. 安装 tensorflow-2.0
    • 最简单的安装方法是使用 pip 安装。这样的问题是:使用的时候会有 AVX Warning,原因是:pip 方法会提供的适配性最高的安装包,但是当前 CPU 支持更高效的 tensorflow 使用方式(AVX),所以才会有这个 Warning。这个不影响使用,可以不用管
    • 解决方案是下载官方 tensorflow 的源码,重新编译。当然网上也提供了编译好了的版本,自行搜索下载,安装即可。
  4. 检测是否安装成功
    • 可以在 python 中输入以下代码,能正常运行即可
    import tensorflow as tf
    a = tf.constant(1)
    b = tf.add(a, a)
    print(b)    
    

安装 tensorflow-gpu-2.0

  1. 系统检查
    • 电脑必须带N卡,且安装了驱动。建议安装最新的N卡驱动,这样做的原因是:新的驱动支持的CUDA的版本也相应的较高。比如445版本号能支持到还未发行的11.0。
    • 查看最高支持的CUDA版本。打开系统的Nvidia控制面板,点击左下角 系统信息 -- 组件 -- NVCUDA.DLL,自己的是 NVIDIA CUDA 10.2.115 driver. 这代表着:最高的CUDA版本是 10.2.115
  2. 软件准备
    • 按照查到的这个版本,搜索下载CUDA。2020-05-27更新tensorflow-gpu=2.2.0版本暂不支持10.2版本,在使用import tensorflow会报错;10.1版本没问题
    • 在一台电脑上是可以安装多个版本的CUDA的,所以如果你安装了10.2,可以继续安装10.1,过程不变,只需要设置环境变量时,10.1要在10.2前面。
    • 下载 CUDNN。这个需要使用 Nvidia 的账号。请注意:CUDNN 和 CUDA 是匹配的,一定要下载对应的最新版本。比如 V7.6.6 和 V7.6.4 都是 CUDA10.0 的CUDNN,那么选择第一个。
    • import tensorflow报错,找不到 cudnn64_7.dll文件。这种类似的错误,可能是CUDA版本太新/旧;CUDNN版本不对应。
  3. 安装 CUDA & CUDNN
    • 选择自定义安装;如果不想安装在 C盘,但是为了以后使用方便,可以在D盘等其他位置新建相应目录,比如:D:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0
    • 如果没有刚需,像是 NVDIA PHYSX,NVIDIA GEFORCE EXPERIENCE这样的软件没有必要安装;其中VS Integration 不要勾选,NVIDIA 驱动也不要勾选,因为我们已经安装好了驱动。
    • 将 CUDNN 复制到相应的 CUDA 安装文件位置。
    • 配置环境变量,测试CUDA是否安装成功等善后工作相信你也能在其他文章见到。
  4. 在 conda 环境中安装 tensorflow-gpu 版本,测试能否使用 N卡计算

编译 Nvidia Samples

  1. 安装 VS2017,安装中注意选择安装 Windows 10 SDK(10.0.15063)。这里使用VS2019也是可以的。

  2. 最重要的一步 使用解压缩软件打开 CUDA 的安装程序,解压 MSBuildExtensions 这个文件夹出来(这就是上一步没有选择安装 vs integration的原因)。具体路径:CUDAVisualStudioIntegration/extras/visual_studio_integration/MSBuildExtensions

  3. 将这个文件夹下的文件复制到 vs2017 的安装目录,自己的是 D:\Program Files (x86)\Microsoft Visual Studio\2017\Community\Common7\IDE\VC\VCTargets\BuildCustomizations

如果是VS2019,那么对应的路径应该是D:\Program Files (x86)\Microsoft Visual Studio\2019\Community\MSBuild\Microsoft\VC\v160\BuildCustomizations

  1. 打开 Samples_vs2017.sln,可以在项目上右键--生成,如果报错可查看10.0.15063这个SDK版本是否安装。生成成功的解决方案(.exe文件)可以在 ..\Samples\V10.0\bin\win64\Debug 这个文件夹下查看

  2. 我不这样操作可以吗?我自己思考了一下,上面的解决方案可能适用于:安装CUDA前没有安装VS,或者VS没有装在默认位置,比如我的VS就装在了D盘,还有一些其他情况我也不清楚。

我只能说,我每次这样做都没有问题,不管是在python中导入tensorflow,还是使用VS编译Samples,都能成功,所以我推荐其他人这样做。

所以,如果你无法在VS中编译Samples,或者CUDA安装失败(有时候安装CUDA勾选VSIntegration可能会安装失败),可以尝试以上方法。

相关资源和其他问题

  1. 关于 AVX 问题,大家可以在这个站点上下载到对应的 .whl 文件,使用 pip install xxx.whl 即可安装。请注意:这个站点的安装包对于 CUDA 和 CUDNN 的版本是有规定的,一定要对应好!网页链接