配制远程服务器跑深度学习Ubuntu 16.04/tensorflow-GPU2.0.0/Driver Version: 440.44/CUDA10.0.130,CUDNN7.6.4/pycharm

本文详细介绍了在Ubuntu16.04上配置远程服务器运行深度学习任务的过程,包括安装TensorFlow-GPU2.0.0、CUDA10.0.130、CUDNN7.6.4及PyCharm,涵盖依赖包安装、环境变量设置、显卡驱动与CUDA/CUDNN安装等关键步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

配制远程服务器跑深度学习Ubuntu 16.04/tensorflow-GPU2.0.0/Driver Version: 440.44/CUDA10.0.130,CUDNN7.6.4/pycharm

本文以搭建学校实验室远程服务器为例,尽肯能用简洁的语言描述。
注!安装之前一定要选择对应的版本(包括Tensorflow,CUDA,CUDNN),参考表

查看cuda 版本
cat /usr/local/cuda/version.txt
查看cudnn 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
查看显卡驱动版本
cat /proc/driver/nvidia/version
或输入nvidia-smi

一、安装依赖包

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install git cmake build-essential

输入以下代码验证是否成功

git cmake build-essential

二、配制环境变量

sudo gedit ~/.bashrc
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH

保存退出

source ~/.bashrc

三、安装显卡驱动
卸载原有驱动

sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-390.59.run --uninstall

安装驱动

sudo chmod a+x NVIDIA-Linux-x86_64-390.59.run
sudo ./NVIDIA-Linux-x86_64-390.59.run –no-opengl-files

查看驱动

在这里插入代码片

四、安装CUDA
官网选择CUDA下载
在这里插入图片描述
cd 到安装包目录下

sudo chmod +x 文件名
sudo sh 文件名

出现选项,前两个选项如下选择,其余要么是Y,要么回车

Do you accept the previously read EULA?
accept/decline/quit: accept
 
Install NVIDIA Accelerated Graphics Driver ?
(y)es/(n)o/(q)uit: n

配制CUDA环境变量

sudo gedit ~/.bashrc

文档后添加

export PATH=/usr/local/cuda-版本号/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-版本号/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存退出

source ~/.bashrc

验证CUDA是否安装

cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

五、安装CUDNN
官网下载对应CUDA版本号的CUDNN,需要注册帐号并登录
解压

cp  cudnn-版本号-linux-x64-v5.1.solitairetheme8 cudnn-版本号-linux-x64-v5.1.tgz
tar -xvf cudnn-版本号-linux-x64-v5.1.tgz
cd cuda
sudo cp lib64/lib* /usr/local/cuda/lib64/ #复制动态链接库
sudo cp include/cudnn.h /usr/local/cuda/include/ 
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.5 #删除原有动态文件
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5 #生成软衔接
sudo ln -s libcudnn.so.5 libcudnn.so #生成软链接
#注,含有版本号的需要进入文件夹查看具体版本号

六、pycharm连接到远程服务器
File -> Settings-> Project -> Project Interpreter,点击小齿轮选择show all,点击+号。选择SSH interpreter,输入远程服务器IP。紧接着按步骤来,输入密码,以及远程服务器python的文件夹(可用which python查找),以及pycharm存放在远程服务器的路径。确定之后本地项目会自动更新到远程服务器。连接完成。
在这里插入图片描述
七、踩过的坑
1、tensorflow版本太高,需要卸载tensorflow

pip uninstall tensorflow

安装指定版本tensorflow

pip install tensorflow==版本号

2、cuda以及cudnn无法下载,怀疑是国内ip被屏蔽,后通过外网下载获得。
3、Could not load dynamic library ‘libcudart.so.10.0’

conda install cudatoolkit=10.0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值