前言
有时生产环境无法连外网,为了让AI应用以容器的方式在GPU机器上跑起来,有很多软件要安装,软件的依赖关系较麻烦,这里将一次可行的安装过程记录下。
一些说明
- 物理机只需安装nvidia驱动,不用装cuda,镜像里面有就可以了。
- 为了让docker容器的nvidia穿透到宿主机上需要安装下面四个插件。注意安装这几个插件后要执行 systemctl restart docker 重启docker服务才行。
yum install nvidia-container-toolkit-1.7.0-1.x86_64.rpm nvidia-container-runtime-3.7.0-1.noarch.rpm libnvidia-container-tools-1.7.0-1.x86_64.rpm libnvidia-container1-1.7.0-1.x86_64.rpm
安装显卡驱动
驱动依赖包
- dkms,选择适当的版本,例如dkms-2.2.0.3-30.git.7c3e7c5.el7.noarch.rpm。
驱动包
到官网选择对应的显卡和操作系统的版本,然后点击下载。https://www.nvidia.cn/Download/index.aspx