1.1 制作ubuntu系统安装盘
1.1.1 下载ubuntu18.04的镜像
链接:https://pan.baidu.com/s/1kK9OD1dYyleq1BGBiMXpvA
提取码:6666
1.1.2 准备一个8G以上的U盘,把系统烧录进去
烧录软件我使用的是rufus
官方下载地址:rufus官网
使用教程:在 Windows 中制作 Ubuntu 系统的USB启动盘
1.2 U盘启动安装ubuntu系统
不同机器进入bios的按键和切换启动项的按键不同,一般是F2,F11,DEL其中一个进入BIOS或者切换启动项的目录。选择刚刚制作的ubuntu系统盘的U盘启动。
安装教程:Ubuntu18.04安装教程
安装ubuntu的时候,比windows安装多了一个分配空间的问题。
我的硬盘是128G的,实际上只有120G。我没有分配上面博客说的那么多的分区。而只是分了4个区域。
/ 30G (apt-get install 的软件是安装在根目录) 主分区,空间起始位置
/boot 1G 主分区,空间起始位置
swap 16G (我的电脑内存16G,所以分给他16G)。逻辑分区, 空间起始位置
/home 分配完上面的分区,剩下的内存都给/home。 逻辑分区,空间起始位置
**安装好系统后第一件事情就是更换软件源。**因为系统自带的源在国外,速度比较慢,容易卡死。所以一般要切换到国内的源。
我一般是使用阿里源.更换方法有两种。1.更改sources.list文件更换 2.在软件与更新中去更换源地址。
更改文件修改:Ubuntu更换阿里云软件源
在设置中更换源(更简单,推荐用这种方式)
2.安装GPU驱动 & cuda & cudnn环境
2.1 三者之间的关系
我一开始并不是很懂得,安装一个GPU相关的东西,就需要安装这么多东西。因为在windows上,不弄深度学习之前,我电脑一般就只会安装一个显卡驱动。现在又是驱动,cuda搞的好复杂。
按我的理解,GPU作为硬件平台,电脑要驱动它,需要一个GPU驱动。CUDA是为了提高GPU并行计算能力做的一个架构(可能就是算法去实现并行运算)。cudnn像是加速计算的插件一样。(因为他不用安装,只是放到cuda安装目录下的文件夹)
2.2 明白自己的需求
安装之前先确定自己需要什么环境。我以百度paddle为例分析
tf不同版本支持的cuda也是不同的。选择你要运行代码的环境进行相对应的安装。
tf对显卡算力也有要求的。N卡算力查询。
安装cuda的时候,cuda对GPU驱动版本限制,
比如:
确定好版本后,下面开始安装。
接下来的安装网上有好多教程,教程太多文章质量就是层次不齐。很多好文章因为发布的晚,搜索引擎把它放的比较后面,很难找。我推一下我觉得比较好的两个课程:
1.ubuntu 18.04安装CUDA环境,包括nvidia驱动、cuda 10.1、cudnn 10.1,人工智能、机器学习必备技能(强烈推荐这个,我就是根据这个安装上的)
2.如何在Ubuntu18.04下安装CUDA10.1和cudnn
2.3 GPU驱动的安装
2.3.1 卸载nouveau nvidia驱动
安装新GPU驱动之前,需要禁止nouveau nvidia驱动。
1.删Ubuntu系统除旧驱动
# 删除
sudo apt-get purge nvidia*
2.禁止自带的nouveau nvidia驱动
# 打开配置文件
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
3.填写禁止配置的内容:
把下面两行添加到文件的最后面,保存后退出。
blacklist nouveau
options nouveau modeset=0
4.更新配置文件,并重启电脑。
sudo update-initramfs -u
5.重启计算机(一定要重启!)
sudo reboot
6.重启后输入
lsmod | grep nouveau #没有输出,即说明安装成功
2.3.2 开始安装驱动
2.3.2.1 自动更新驱动(要先更换前面说的国内源,比如阿里源)
优点:省事
缺点:一般是安装最新版本的驱动,所以可能不符合tf,paddle需要的cuda环境。
sudo ubuntu-drivers autoinstall
2.3.2.2 手动更新源
开始安装
1.在driver run文件目录下打开命令行,运行
sudo chmod a+x (driver.run) 以你下载的文件名为主
2.运行run文件
sudo sh xx.run 或者 sudo ./ xx.run
3.测试驱动是否安装完成
nvidia-smi
应该要输出你电脑的信息,有输出下面这样的信息,说明GPU驱动安装成功。
可能遇到的问题:
Unable to find the development tool cc in your path;
可能是你的系统里没有装gcc,那就装上gcc,类似的,报找不到make,就装一下
sudo apt-get install gcc
sudo apt-get install make
或者使用命令:
sudo apt install build-essential -y 一键安装那些必要软件
2.4 CUDA驱动的安装
2.4.1 cuda安装包的下载
2.4.2 安装命令
1.安装命令和安装驱动一样
sudo chmod a+x (driver.run) 以你下载的文件名为主
2.运行run文件
sudo sh xx.run 或者 sudo ./ xx.run
将会进入下面的安装界面,直接点击install。
之后设置环境变量。
输入 sudo gedit ~/.bashrc 打开主目录下的 .bashrc文件添加如下路径:
export LD_LIBRARY_PATH=
$LD_LIBRARY_PATH:/usr/local/cuda-10.1/lib64
export PATH=$PATH:/usr/local/cuda-10.1/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.1
在命令行输入source ~/.bashrc使之生效。
输入 nvcc --version,如果显示如下文字就说明安装成功了:
如果没有这个指令,他应该会提示没有找到
Command ‘nvcc’ not found, but can be installed with: sudo apt install nvidia-cuda-toolkit
然后根据提示安装即可。
sudo apt install nvidia-cuda-toolkit
验证cuda是否能够正常运行:
因为我们是有安装smaple demo的,所以在最开始~目录下,要有一个nvidia_cuda…._samples 这个文件夹的,进入这个文件夹。
cd 1_Utilities
cd deviceQuery
在deviceQuery这个文件夹中make,会多出一个deviceQuery可执行文件
./deviceQuery 执行,会输出相应的信息
2.5:Cudnn 下载安装
驱动的下载:CuDNN Archive
选择对应cuda的版本下载下来。这个下载需要登陆nvidia,需要有一个nvidia账号,注册一个就行。
安装cudnn
这个就是一个加速的文件,无需安装。
把准备好的cudnn文件复制到已经安装好的cuda文件夹里。cuda安装在usr文件夹里。点开主目录里下面的计算机就可以找到。但是在这里没有办法用拖拽的方式进行复制黏贴(因为没有超级权限),需要使用命令行的方式。安装过程参考自[3]
首先进入cudnn对应的文件夹里。之后敲如下命令
sudo cp cuda/include/* /usr/local/cuda/include
sudo cp cuda/lib64/* /usr/local/cuda/lib64
复制成功就可以了。
最后额外说一点,如果你想卸载显卡驱动的话,可以用这个命令来卸载:
sudo apt-get remove nvidia*
如果想查看隐藏文件夹,可以通过Ctrl + h组合键。