文章目录
前言
前段时间做一个国防的项目,使用鲲鹏服务器+英伟达GA100
显卡,离线环境安装驱动和pytorch
。操作系统使用KylinV10SP2
。python
依赖已经整理好,可以去我的下载资源里去获取。
一、基础环境
1.1、处理器型号
HUAWEI Kunpeng 920 7261K
1.2、英伟达显卡型号
Tesla A100
GA100 [A100 PCIe 40GB]
1.3、操作系统
KylinV10SP2
1.4、软件环境
软件 | 版本 | 下载地址 |
---|---|---|
CUDA Toolkit | 11.8 | https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux_sbsa.run |
cuda-samples | 11.8 | https://github.com/NVIDIA/cuda-samples/archive/refs/tags/v11.8.tar.gz |
python | 3.9.0 | https://www.python.org/ftp/python/3.9.0/Python-3.9.0.tgz |
torch | 2.0.0 | https://download.pytorch.org/whl/torch-2.0.0-cp39-cp39-manylinux2014_aarch64.whl#sha256=a83b26bd6ae36fbf5fee3d56973d9816e2002e8a3b7d9205531167c28aaa38a7 |
torchvision | 0.15.1 | https://download.pytorch.org/whl/torchvision-0.15.1-cp39-cp39-manylinux2014_aarch64.whl#sha256=e9b4bb2a15849391df0415d2f76dd36e6528e4253f7b69322b7a0d682535544b |
torchaudio | 2.0.1 | https://download.pytorch.org/whl/torchaudio-2.0.1-cp39-cp39-manylinux2014_aarch64.whl#sha256=77b953fd7278773269a9477315b8998ae7e5011cc4b2907e0df18162327482f1 |
二、取消内核自动升级
说明:之前使用昇腾服务器,遇到过内核自动升级后 NPU 驱动无法使用的情况,所以这里取消内核自动升级。
- 修改配置文件
/etc/yum.conf
vim /etc/yum.conf
- 在
[main]
的最后添加exclude=kernel*
并保存
三、配置本地yum源
-
将下载好的iso镜像文件上传到服务器指定目录:
/mnt
-
创建挂载目录
mkdir /mnt/iso
-
挂载镜像
mount /mnt/Kylin-Server-10-SP2-aarch64-Release-Build09-20210524.iso /mnt/iso/