Ubuntu18.04中布署CUDA10.1 + CUDNN7.6.1 + Tensorflow-gpu深度学习环境 - 漫步星野

Ubuntu18.04中布署CUDA10.1 + CUDNN7.6.1 + Tensorflow-gpu深度学习环境

在配置Tensorflow环境过程中,由于版本和驱动不对应,导致调试时一直报错,请后续者在配置前,务必参看CUDA和CUDNN与Tensorflow的对应关系后再动手,避免不必要的时间浪费。本文系统环境是Ubuntu18.04,显卡是GeForce GTX960M。链接2在较新的硬件安装时用,可大辐节省时间。

本文参考链接1:https://blog.csdn.net/BigData_Mining/article/details/99670642

本文参考链接2:https://www.cnblogs.com/ManWingloeng/p/11489122.html

一、安装N卡驱动:

1,查看N卡信息。

1 nvidia-smi

2,删除旧版N卡驱动。

1 sudo apt-get remove nvidia-*
2 sudo apt-get autoremove

3,获取系统推荐驱动(括号带recommended的),并安装该驱动,我的是440。

1 ubuntu-drivers devices
1 sudo apt-get install nvidia-settings nvidia-driver-440 nvidia-prime

4,重启。

1 sudo reboot

二、安装CUDA10.1及CUDNN7.6.1

1,查看适合本机的CUDA及CUDNN版本。

1 cat /usr/local/cuda/version.txt
1 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

2,安装CUDA。在http://developer.nvidia.com/cuda-downloads下载安装deb包安装,或直接通过其下介绍的Base Installer方式安装,我这边选了官网的方式(注意:下载时需要注册一个NVIDIA账号,才可继续)。

1 wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
2 sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
3 wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
4 sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
5 sudo apt-key add /var/cuda-repo-10-1-local-10.1.243-418.87.00/7fa2af80.pub
6 sudo apt-get update
7 sudo apt-get -y install cuda

3,安装CUDNN。通过https://developer.nvidia.com/rdp/cudnn-archive下载对应的CUDNN压缩文件,解压获得文件夹cuda,将其整个复制到系统主目录home下。

4,设置环境变量(设置前要安装好Vim)。

1 vi ~/.bashrc

输入如上命令打开bashrc,按字母I键进行输入模式,在最后面加入如下内容,按ESC键后,按shft+:,输入wq保存并退出。

1 export PATH="/usr/local/cuda/bin:$PATH"
2 export LD_LIBRARY_PATH="/usr/lcoal/cuda/lib64:$LD_LIBRARY_PATH"

5,使设置生效。

1 source ~/.bashrc

三、通过pip安装Tensorflow-gpu。

1 sudo pip install tensorflow-gpu