1. 概述
声明:本文章包含原创内容,转载请注明来源,若存在不完善之外,欢迎大家指出,共同完善。
目前网络上没有关于openEuler离线状态,配置pytorch深度学习开发环境的详细文章。本人一顿踩坑,最终才搞明白正确的安装方法。在此与大家分享,我将整个安装过程详尽的列出,并圈出关键点,供大家参考,避免踩坑,节约时间,更快的开炉炼丹。
当然,windows及其他系统离线安装过程大致相同,本文有参考价值,尤其是第6节。
安装平台是联想工作站Workstation PX,CPU5418双路,显卡为A6000双路,系统版本为openEuler 24.03LTS。安装的CUDA12.1,torch版本为2.40,相对应的torchaudio版本这2.4.0,torchvision版本为1.9.0。当然安装其他的系统版本或者开发环境版本流程应该基本相似。
选择openEuler的原因:1)openEuler有everything.ISO,包含了大部分开发工具,适用于离线开发平台;2)是国内开源系统中比较稳定可信赖的发行版之一。另外其他openEuler
注意:第6节pytorch的安装是难点,之前没有搜索到正确方法,其实也简单。
2.安装系统UI
新安装的openEuler系统没有操作界面,但可以安装UKUI,DDE,XFCE,本人个人电脑的主力操作系统是deepin,在此选择了UKUI。
2.1第一步是下载UKUI离线安装包
办法是在有网络的计算机上以“虚拟机(VirtualBox etc.)”的方式,安装与离线计算机上相同版本的openEuler系统,系统安装过程中最好选择一样的系统软件配置参数。(注意:如果你安装的也是openEuler24.03可以从本小节最后提供的百度网盘链接直接下载,不用折腾了!)
虚拟机里系统安装完毕后在,终端里输入如下命令[1]:
dnf download --resolve ukui --destdir=/home/soft/UI
其中,/home/soft/UI是想要保存了目录,可以自己修改。如果下载DDE的话,直接把上述命令中的“ukui”换成“dde”即可,字母均小写。下载完成后导出到虚拟机的宿主主机,可以采用FTP的方式或虚拟软件支持复制等方式,不知为何,本人以上两种方式均没搞定,就直接上传到百度云盘里了,然后又用宿主主机下载下来。如果你安装的是openEuler24.03,可以直接从下的百度网盘链接下载:
链接: https://pan.baidu.com/s/1RsS-GZ9OYdWQZPpzOy-qyQ 提取码: ykrf
2.2UKUI的安装
将下载好的UI包光盘等方式复制到离线计算机上,使用unzip命令解压缩包并进入到其目录。在终端使用如下命令
chmod 644 *.rpm
给全部rpm文件赋权,然后使用如下命令安装
rpm -ivh --nodeps --force *.rpm
或者,如果有问题则尝试如下命令:
dnf -y install ./*.rpm --skip-broken
在终端继续使用如下命令,配置开机启动项。
systemctl set-default graphical.target
最后输入:
sudo reboot
重启计算机即可进入图形界面了。
下面几步:安装显卡驱动、CUDA、cudnn、Anaconda3等,与在deepinV23安装区别不大(链接),但为了教程介绍的完整性,在此再一一列出,部分图片将引用那篇文章的(当时安装时没有留存图片)。
3.显卡驱动安装
3.1 显卡驱动下载
驱动的版本需要匹配自己的显卡型号即可。查看机器上显卡命令如下:
lspci | grep -i vga
到Nvidia官网驱动下载页面下载驱动。
本文选用的显卡驱动是NVIDIA-Linux-x86_64-550.78版。
2.3.2 禁用NVIDIA驱动Nouveau模式
1)在终端下使用如下命令[2]:
sudo vim /usr/lib/modprobe.d/dist-blacklist.conf
注释掉:`blacklist nvidiafb`这一行
2)在文件最后添加如下内容:
blacklist nouveau
options nouveau modeset=0
注意:一定要注释掉blacklist nvidiafb这一行,否则禁用nouveau会失败。
3)然后重建initramfs image,执行下面的命令:
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r)-nouveau.img
sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)
再执行
lsmod | grep nouveau
如果没有任何输出则表明禁用成功。如果不成功,则重启后再试,一般正常。
重新启动
在终端输入sudo reboot,或者在界面中选择关机均可。
注意:重新启动后,界面启动可能不正常了,分辨率非常低,不用慌,继续安装即可。
3.2 安装显卡驱动
注意显卡驱动的下载目录,在该目录下打开终端,为驱动程序添加可执行权限。
sudo chmod a+x NVIDIA-Linux-x86_64-550.78.run
然后运行命令
sudo ./NVIDIA-Linux-x86_64-550.78.run -no-opengl-files -no-nouveau-check
开始安装。