真锋
永远保持一颗学习和专注的心
嵌入式视觉笔记

Ubuntu18.04深度学习环境配置(CUDA9.0+CUDNN7.4+TensorFlow1.12/Keras)

个人硬件配置

  • 技嘉Z370 HD3P主板(899)
  • i7-8700k处理器(2699元)
  • 二手技嘉小雕1080ti显卡(4423元)
  • 光威32g内存(559×2元)
  • Intel 512g固态硬盘(799元)
  • 振华650w电源(545元)
  • 黑曼巴机箱(277元)
  • 九州风神CPU散热器(99元)
  • CPU导热硅脂(9.9元)
  • 合计11000元

系统安装

  1. 去Ubuntu官网下载.iso镜像文件,选择Ubuntu18.04.2 LTS(桌面长期支持版)
  2. 用UltraISO+U盘制作系统盘,安装过程很简单,单系统安装默认操作即可,固态硬盘几分钟搞定。

常用软件安装

作为程序员,一些必备软件是不可缺少的,下面是我推荐使用的必备安装软件:

  • 浏览器:谷歌浏览器
  • 翻墙工具:Shadowsocks-qt5
  • 输入法:搜狗输入法
  • IDE:Pycharm,Anaconda3(数据分析工具)
  • 代码编辑器:Sublime Text3(速度快,轻量)
  • 笔记工具:为知笔记(免费版够用,支持md语法,多平台通用)
  • 远程控制工具:TeamViewer(个人使用不收费)

深度学习环境搭建

  1. 安装1080TI显卡驱动
  2. 安装依赖库
  3. GCC版本降低
  4. 安装CUDA9.0
  5. 安装CUDNN
  6. 安装Anaconda3
  7. 安装TensorFlow-gpu 1.12和Keras 2.2

安装1080TI显卡驱动

删除系统默认安装的显卡驱动
sudo apt-get purgenvidia*
我在这里看到说,要关闭系统默认显卡驱动,但是实际上我没关闭,后续操作也成功了。
添加Graphic Drivers PPA并更新源
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
如果更新源失败,建议重新添加并更加,我第一次也失败了,后来重复一次就成功了。
查看系统合适的显卡驱动版本
ubuntu-drivers devices

我这里系统推荐安装415版本(最新版),其实396版本也是可以的。
安装415版本驱动:
sudo apt-get install nvidia-driver-415
安装完毕后重启电脑 (必须操作)
sudo reboot
检查NVIDIA显卡驱动状况
nvidia-smi

安装依赖库

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-devlibgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
有些依赖库系统可能已经装了。

降低GCC版本

cuda 9.0 编译安装只支持gcc、g++ 6.0 及以下的版本,Ubuntu18.04系统默认安装了gcc7.0以上的版本,所以,就需要降级了。
安装gcc5.0版本
sudo apt-get install gcc-5
sudo apt-get install g++-5
这里安装gcc4.8版本也是可以的。
通过shell命令更换gcc版本
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
查看降级后的gcc版本
g++ -v
gcc -v

安装CUDA9.0

可以自行到NVIDIA官网下载,也可以到黄海博博士公众号(机器学习初学者)上下载,官网下载界面截图如下:

自行下载,需要安装一个基础安装包和四个补丁文件,即下载Base Installer和4个Patch包。
进入安装包目录,依次执行以下4个命令:
注意:在安装过程中会提示是否需要安装显卡驱动,在这里要选择n,其他的选择y或者回车键进行安装,5个文件安装一开始都需要阅读很多提示,这是正常的
sudo sh cuda_9.0.176_384.81_linux.run
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run

其中cuda_9.0.176_384.81_linux.run 安装过程如下图所示:

在~/.bashrc 中设置环境变量:
sudo vi ~/.bashrc
在最后添加:
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
运行命令
source ~/.bashrc
为了使其生效,最好重启一下系统。
sudo reboot
重启后,测试CUDA是否成功(此步骤可以省略)
cd ~/NVIDIA_CUDA-9.0_Samples/1_Utilities/deviceQuery
make -j4
sudo ./deviceQuery
若会输出相应的显卡性能信息,Result = PASS,表明CUDA安装成功

安装CUDNN7.4.1

可以自行到NVIDIA官网下载,也可以到黄海博博士公众号(机器学习初学者)上下载,官网下载界面截图如下:

注意,这里自行下载,得先在NVIDIA网站注册一个账号登录以后才能进入CUDNN下载页面。
这里安装比较简单,类似windows系统下安装。先解压压缩包,然后复制文件到指定目录下,再给予目录权限即可。
运行命令如下:
tar -zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

安装Anaconda3

Anaconda3官网下载安装包,我这里下载的是命令行安装的包,安装操作非常简单,根据提示安装即可。 注意,安装好Anaconda3之后需要关闭原来的终端,重新打开一个终端才能使用conda命令。

更改pip和conda下载源为国内的源,

  • 更改pip的源为阿里云:
mkdir ~/.pip
cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.aliyun.com
index-url=https://mirrors.aliyun.com/pypi/simple/
EOF
  • 更改conda的源为清华大学:
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    conda config --set show_channel_urls yes
  • 在Anaconda中安装Python3.6的虚拟环境
    conda create --name tf python==3.6 # 创建命名为tf的虚拟环境
    conda activate tf # 激活tf虚拟环境
    conda deactivate # 退出tf虚拟环境
    conda remove --name tf --all #删除tf环境(全部删除)
    值得注意的是,不同的Anaconda3版本命令会有所变化,其实在虚拟环境创建成功后,会有提示如何进行激活退出和删除虚拟环境,更多命令可自行谷歌。

安装TensorFlow-gpu和Keras

linux终端中输入以下命令:
pip3 install tensorflow-gpu
pip3 install keras
或者Anaconda3激活虚拟环境后输入:
pip install tensorflow-gpu
pip install keras
注意,截止到目前(2019-2-19),上面方式安装后得到的tensorflow-gpu版本是1.12。


TensorFlow安装后运行报错ImportError: libcublas.so.9.0…

详细错误如下:

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

解决办法:
检查 /usr/local/cuda-9.0/lib64 下是否有 libcublas.so.9.0
如果有,终端输入:
sudo ldconfig /usr/local/cuda-9.0/lib64


参考链接

Ubuntu 18.04深度学习环境配置(CUDA9.0+CUDDN7.4+TensorFolw1.8)
ubuntu18.04+CUDA9.0+cuDNN7.1.4+tensorflow1.9 环境搭建
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

赞赏
# #
首页      计算机基础      开发者工具      Ubuntu18.04深度学习环境配置(CUDA9.0+CUDNN7.4+TensorFlow1.12/Keras)

发表评论

textsms
account_circle
email

嵌入式视觉笔记

Ubuntu18.04深度学习环境配置(CUDA9.0+CUDNN7.4+TensorFlow1.12/Keras)
个人硬件配置 技嘉Z370 HD3P主板(899)i7-8700k处理器(2699元)二手技嘉小雕1080ti显卡(4423元)光威32g内存(559×2元)Intel 512g固态硬盘(799元)振华650w电源(545元)黑曼巴机箱(277元)九…
扫描二维码继续阅读
2019-02-19