教程-Ubuntu-18.04-安装Nvidia驱动程序和CUDA和CUDNN并构建用于gpu的Tensorflow:Ubunt...


在本教程中,我们将深入探讨如何在Ubuntu 18.04操作系统上安装Nvidia驱动程序、CUDA工具包以及CUDNN库,并进一步构建适用于GPU的TensorFlow环境。这是一个涉及多步骤的过程,需要对Linux系统、编译工具和深度学习框架有一定了解。以下是详细的操作指南: 1. **安装Nvidia驱动程序** 在安装Nvidia驱动之前,需要确保系统已更新到最新版本: ``` sudo apt update sudo apt upgrade ``` 接着,添加Nvidia官方仓库: ``` sudo add-apt-repository ppa:graphics-drivers/ppa ``` 更新源后,安装最新的Nvidia驱动: ``` sudo apt install nvidia-driver-<version> ``` 替换`<version>`为当前可用的版本号。 2. **禁用 Nouveau 驱动** Nouveau是开源的Nvidia图形驱动,可能与Nvidia官方驱动冲突。在安装Nvidia驱动前,需要临时禁用Nouveau。在GRUB启动加载器中选择“恢复模式”,然后执行: ``` sudo mv /lib/modules/$(uname -r)/kernel/drivers/gpu/drm/nouveau /lib/modules/$(uname -r)/kernel/drivers/gpu/drm/nouveau.bak ``` 3. **安装CUDA工具包** 下载CUDA官方安装包,根据你的系统架构选择合适的版本。访问Nvidia官网下载页面并遵循提示。安装时使用默认选项,但确保取消对Nvidia图形驱动的安装,因为已经在上一步骤中单独安装了。 4. **安装CUDNN** CUDNN是Nvidia提供的深度学习加速库。同样,访问Nvidia官网下载页面获取CUDNN的.tgz文件。解压后将头文件复制到CUDA安装目录的include目录,库文件复制到lib64目录: ``` sudo cp -P cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp -P cuda/lib64/* /usr/local/cuda/lib64/ ``` 5. **配置环境变量** 编辑`~/.bashrc`文件,添加以下行来设置CUDA和CUDNN的路径: ``` export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH ``` 保存并使更改生效: ``` source ~/.bashrc ``` 6. **安装Bazel** Bazel是Google的构建工具,用于构建TensorFlow。首先安装依赖: ``` sudo apt install build-essential curl ``` 下载Bazel安装脚本并执行: ``` curl https://bazel.build/bazel-release.pub.gpg | sudo gpg --dearmor > bazel.gpg sudo mv bazel.gpg /etc/apt/trusted.gpg.d/ echo "deb [arch=amd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list sudo apt update sudo apt install bazel ``` 7. **安装Python 3 和 GCC 编译器** 如果尚未安装,可以使用以下命令安装: ``` sudo apt install python3-dev python3-pip sudo apt install gcc ``` 8. **构建TensorFlow for GPU** 克隆TensorFlow源代码: ``` git clone https://github.com/tensorflow/tensorflow.git cd tensorflow ``` 配置构建选项,确保启用GPU支持: ``` ./configure ``` 在配置过程中,当询问是否使用GPU时,输入`y`。然后,使用Bazel构建TensorFlow: ``` bazel build --config=cuda //tensorflow/tools/pip_package:build_pip_package ``` 创建pip包并安装: ``` bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg pip3 install /tmp/tensorflow_pkg/*.whl ``` 9. **验证安装** 安装完成后,通过运行简单的TensorFlow示例来验证GPU支持: ``` python3 import tensorflow as tf device_name = tf.test.gpu_device_name() if device_name != '/device:GPU:0': raise SystemError('GPU device not found') print('Found GPU at: {}'.format(device_name)) ``` 至此,您已在Ubuntu 18.04上成功安装了Nvidia驱动、CUDA、CUDNN,并构建了适用于GPU的TensorFlow环境。现在,您可以开始使用GPU进行深度学习计算了。注意,随着软件版本的更新,上述步骤可能需要微调。务必检查每个软件的官方文档以获取最新的安装指南。


















