TensorFlow安装,版本切换等问题

可以在官网查看经过测试的TensorFlow版本对应的CUDA和Cudnn:https://tensorflow.google.cn/install/source#linux

Tensorflow-gpu安装

一、环境变量

OS:ubuntu-18.04

编程语言:Python3.6

二、安装步骤

2.1搞清楚要安装TensorFlow-GPU版本对应的CUDA和Cudnn,具体如下表:

2.2下载Ubuntu对应版本的驱动,CUDA以及Cudnn(注NVIDIA驱动装最新版)

NVIDIA驱动(.run)下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn

CUDA(.run)历史版本下载地址:https://developer.nvidia.com/cuda-toolkit-archive

cuDNN(.deb)下载地址:https://developer.nvidia.com/rdp/cudnn-archive

2.3 Ubuntu下安装NVIDIA驱动

1)关闭UEFI Secure Boot选项(很重要)

2)打开终端,删除旧的驱动:

sudo apt-get purge nvidia*

3)禁用自带的 nouveau nvidia驱动

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在vim中添加如下内容:

blacklist nouveau

options nouveau modeset=0

更新,重启:

sudo update-initramfs -u

sudo reboot

验证是否已经禁止nouveau nvidia驱动:

lsmod | grep nouveau

4)进入文本模式安装驱动:

使用Ctrl+Alt+F4命令切换到文本模式,切换至你下载驱动(.run)的路径下安装:

sudo ./NVIDIA.run

确认是否安装成功(根据左上角的NVIDIA-SMI即你下载的版本号对应):

nvidia-smi

nvidia-settings

2.3 Ubuntu下安装CUDA驱动

1)GCC降级:

由于CUDA 9.0仅支持GCC 6.0及以下版本,而Ubuntu 18.04预装GCC版本为7.3,下载GCC-4.8,g++-4.8版本,并切换至该版本。

sudo apt-get install gcc-4.8

sudo apt-get install g++-4.8

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 100

sudo update-alternatives --config gcc

2)安装CUDA及其补丁:

sudo sh cuda_10.1.85_387.26_linux.run

sudo sh cuda_10.1.85.1_linux.run

sudo sh cuda_10.1.85.2_linux.run

sudo sh cuda_10.1.85.3_linux.run

2.3 Ubuntu下安装cuDNN驱动

直接在相应目录下执行命令进行安装(下例版本不对):

sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb

sudo dpkg -i libcudnn7-dev_7.0.3.11-1+cuda9.0_amd64.deb

sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb

验证cuDNN是否安装成功:

cp -r /usr/src/cudnn_sample_v7/ $HOME

cd $HOME/cudnn_sample_v7/mnistCUDNN

make clean && make

./mnistCUDNN

2.4 Ubuntu下安装TensorFlow-gpu==1.14.0

建议先安装virtualenv,然后在虚拟环境下安装TensorFlow,当然也可以直接安装TensorFlow。

安装过程:https://www.cnblogs.com/SsoZhNO-1/p/11177633.html

当你进入虚拟环境后,安装TensorFlow-GPU:

# Source ./activate

Pip install tensorflow-gpu==1.14.0

2.5Ubuntu18.04安装cuda8

在安装cuda8和cuda9的时候,都没有对应Ubuntu18的run文化,对于cuda9我们可以直接安装ubuntu17,在安装多个版本的时候。选择过程如下图:

其中在安装cuda8的时候可能会出现如下错误:

解决方法:

log中给出了几个目录的位置,并且说明在这些目录下都无法找到InstallUtils.pm(can't locate InstalUtils.pm)

选取多个目录中的一个,先记录下来。

我选取的一个是目录是 /usr/lib/x86_64-linux-gnu/perl5/5.26

打开终端,进入放着cuda 8.0 runfile安装文件的路径下面,即 cuda_8.0.61_375.26_linux.run 的路径下。

具体操作方法如下:

1)解压runfile文件

$ sh cuda_8.0.61_375.26_linux.run --noexec --target 001

#将runfile文件解压并且放到001,文件夹中(001可自动创建

2)进入解压后的文件夹,将InstallUtils.pm拷贝到之前我们从log中记录的文件目录下,注意可能使用sudo以获得管理员权限

$ sudo cp InstalUtil.pm ***** #拷贝复制,*****指目标目录,这里我使用的是/usr/lib/x86_64-linux-gnu/perl5/5.26

3)输入export $PERL5LIB

$ export $PERL5LIB

再次尝试运行cuda 8.0 的runfile文件,安装成功!

参考:https://blog.csdn.net/u014529295/article/details/78820414

在安装多版本cuDNN的时候(原来是7.4,现在换成了6):

至此,版本从1.14.0退回到了1.4.0

切换CUDA版本

sudo rm -rf /usr/local/cuda #删除之前创建的软链接

sudo ln -s /usr/local/cuda-8.0 /usr/local/cuda #创建新 cuda 的软链接

Roi_pooling动态库编译

一、环境变量

OS:Ubuntu18.04

编程语言:python3.6

深度学习框架:TensorFlow-GPU==1.14.0

二、安装步骤

Bash Code/DeepLogo_v2.1_gpu/Lib/make.sh

(该脚本代码和原代码不同,已经被我改成适应该版本代码)