在linux + RTX3080上运行深度学习的经验

最新推荐文章于 2025-02-28 23:51:44 发布

李代数

最新推荐文章于 2025-02-28 23:51:44 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏：联邦学习文章标签：深度学习 linux 人工智能 CUDA

本文链接：https://blog.csdn.net/user_lib/article/details/127151198

联邦学习专栏收录该内容

2 篇文章

订阅专栏

失败与经验分享

失败一：RuntimeError: CUDA error: no kernel image is available for execution on the device

在这里插入图片描述

查看torch, cuda版本命令

在这里插入图片描述
如果你是30系显卡，又和我的版本一样，那肯定会报错误。

解决方法

错误原因在于CUDA版本不对，一般30系列显卡对应的CUDA版本使用10.2以上，本人选择使用Cuda11.1
所有可以选择重新安装torch及cudnn.

pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html

成功安装之后，在import torchvision可能又遇到失败三ImportError: /lib64/libstdc++.so.6: version `CXXABI_1.3.9‘ not found
解决办法到失败三中找。

失败二：GeForce RTX 3080 with CUDA capability sm_86 is not compatible with the current PyTorch installation

解决方法和上面的一样，这个就是提醒你是CUDA版本不支持你的显卡。

失败三：ImportError: /lib64/libstdc++.so.6: version `CXXABI_1.3.9‘ not found

解决办法：

第一种方法：可以照搬该**博客**
如何你没有root权限，那就使用第二种方法
第二种方法
照搬博客

提醒，这只是我个人的失败与教训，先查看你的硬件软件版本，你的环境配置。

如果问题没有解决可以私聊。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李代数

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Ubuntu 21.04系统安装 + Nvidia RTX3080 Ti 显卡驱动安装+驱动安装后重启黑屏解决+cuda+pytorch深度学习环境搭建

weixin_46203866的博客

08-05

6139

Ubuntu 21.04系统安装 + Nvidia RTX3080 Ti 显卡驱动安装+驱动安装后重启黑屏解决+cuda+pytorch深度学习环境搭建前言因为要做论文的实验，实验室新购置了3080TI，配置ubuntu深度学习环境，因为在安装3080TI的显卡驱动上遇到很多次问题，便做一个经验分享 1. Ubuntu 21.04 系统安装 1.1 准备系统盘在ubuntu 官网下载官方镜像（21.04 河马系统）使用 Rufus 制作系统盘尝试了18.04、20.04系统，能装系统，但

2024年最新动手组装深度学习机器+RTX2070Super

2401_84691713的博客

05-02

1194

对于深度学习，GPU是最重要的，由于目前只有nvidia显卡支持Cuda，因此别无他选，参考多篇博文，目前在kaggle获奖得主推荐使用RTX2070，考虑未来的扩展性，我选择了RTX2070Super；，就深度学习而言对于CPU的要求并不高，AMD和Intel都可以，同样性能的CPU，Intel价格大概是AMD的两倍左右，但是作为强迫症患者，我还是选择了Intel i7 9700k，但是超频好像真的是有些性能冗余；

2 条评论您还未登录，请先登录后发表或查看评论

Win10+RTX3080深度学习环境搭建，执行YOLO目标检测

qq_41536059的博客

06-15

2571

1 软件安装硬件环境：RTX3080 软件环境：WIN10，CUDA11.1，cuDNN8.0.4，python，VS，opencv3.4.2（？github上说opencv4不支持3080），vcpkg（版本待定） opencv需要编译 2 配置YOLO 3 训练YOLO 4 目标检测

linux 配置pytorch_RTX 3080深度学习环境配置

weixin_39598069的博客

11-21

998

找资料的时候感觉现在写30XX系显卡深度学习环境配置的文章还不太完善，所以记录了自己的采坑经历。Why？下面这张图非常直观，TITAN性能比2080ti强，3080的CUDA核心数差不多是TITAN的两倍，内存少一些。目前3080显卡7000出头可以拿下，性价比非常不错。1 准备工作上半年配了台支持4GPU的机器，原计划下半年训练任务上来以后再加卡。但是30XX显卡出来以后，2个3080...

ubuntu16 cuda配置

weixin_30696427的博客

11-06

171

# 安装cuda8.0 runfile # 第一个驱动选择n # 解压cudnn tar.gz包 sudo cp cuda/include/cudnn.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod a+r /usr/local/cuda/include/cudnn....

深度学习系列之环境配置（i7-10700 + RTX3080+32G+500G）

weixin_38716233的博客

05-04

3608

深度学习系列 深度学习环境配置（i7-10700 + RTX3080+32G） Windows 10 环境搭建–仅供参考。前言针对本配置电脑安装包版本： 1：CUDA的版本： cuda_11.4.2_471.41_win10.exe 2：Cudnn的版本： cudnn-11.4-windows-x64-v8.2.2.26 3：Anaconda的版本： Anaconda3-2020.02-Windows-x86_64.exe 4：python的版本： python3.7 5：torch的版本： 1.7.1

RTX 3080 Linux和Windows 平台兼容性问题

yinpizong5319的博客

10-15

3443

好不容易在某电商平台抢到了一块3080显卡，高高兴兴的装机准备大搞游戏开始深度学习，却遇到了很多麻烦，当然经过多方探索，终于也是解决了linux和Windows双平台的兼容性问题，目前Pytorch和TensorFlow都能使用。首先是linux平台最快方法：去NVIDIA官网下载cuda11.1，从这个版本才开始支持30系列显卡。同时记得把cudnn也顺便下载了。cuda11.1自带显卡驱动，所以显卡驱动无需单独安装，提前装了也没事。深坑：Linux不同的发行版的桌面可能对30系显卡存在兼容

动手组装深度学习机器+RTX2070Super

m0_60635176的博客

05-01

1406

Ubuntu18.04+RTX 2080Ti+CUDA 10.0 +cuDNN+PyTorch搭建深度学习环境

silver1225的博客

09-02

9889

基本硬件环境硬件基本信息硬件型号 CPU I7-9700k GPU RTX 2080ti 内存 DDR4 2666 16GB*2 主板 ASUS Z390-A 机箱 Tt(Thermaltake) 启航者S5 电源海盗船 850W 支持2080ti SSD固态硬盘三星 500GB M.2接口 860 EVO HHD机械硬盘西部数据 1TB S...

Linux在CUDA11.5+RTX3090+pytorch构建深度学习环境时CUDA版本冲突导致的no kernel image is available for execution问题

whatifleave的博客

07-14

2267

pytorch是非常优秀的深度学习包，面向GPU部分封装的非常好，可以便利的将模型传入GPU中，利用GPU进行深度学习。但是笔者在用pytorch进行环境配置时撞了大坑，最终解决发现是之前下载了CUDA10.2版本的pytorch，和系统实际使用的CUDA版本11.5不匹配。以此文记录最终解决和过程中所学到的知识。...

吐血整理亲测有用 3080ti cuda pytorch深度学习环境安装

qq_35724582的博客

10-23

7404

sudo add-apt repository ppa:graphics-drivers //更新源 sudo apt-get install nvidia-driver-470 nvidia-settings nvidia-prime sudo apt install nvidia-cuda-toolkit//不要用 3080ti cuda环境安装 nvidia-smi 不成功或者驱动安装不成功可能设置bios 安全模式关闭就可以了 sudo apt-get purege nvidia* //卸载之..

在3080显卡电脑上安装Linux系统

bx_dpj的博客

06-19

2287

nouveau 0000:01:00.0: DRM: failed to idle channel

零基础搭建Linux的ubuntu系统anaconda+pytorch+tensorflow2.x深度学习环境（RTX 3090显卡也适用）

weixin_45941288的博客

12-25

6945

1、下载NVIDIA驱动在官网自行选版本下载：https://www.nvidia.com/Download/index.aspx 2、配置环境 1、安装vim：sudo apt-get install vim 2、编辑文件blacklist.conf：sudo vim /etc/modprobe.d/blacklist.conf 在文件最后部分插入以下两行内容： blacklist nouveau options nouveau modeset=0 3、更新系统：sudo update-initram

【配环境】ubuntu18.04 3080ti显卡+cuda+cudnn+torch

sinat_41670685的博客

07-12

3751

1.打开系统设置中的software & updates点击 System Settings，选择 Additional Drivers 标签，下面会列出当前显卡可用的驱动版本。注意：3080ti建议不要安装最新版本驱动点击Apply Changes即可安装；注意：3080ti只能装cuda11.x 修改软连接修改系统使用的cuda 卸载老版本cuda 重新查询看是否卸载成功显卡驱动及CUDA Toolkit最高对应版本查询驱动版本............

rtx linux 服务端,RTXLinux编程

weixin_33278577的博客

05-09

226

RTlinux主要的api函数实时应用程式分为两部分,内核部分和应用部分,应用部分需要和内核部分通过FIFO进行数据交换和控制,除此之外和一般应用程式没有太多区分,内核部分比较复杂,程式以模块方式挂入内核,这部分程式的编写需要对底层的东西有较高的需要,除了掌控RTLinux的API以外还需要对Linux内核编程有较深的了解,连同对硬件部分也有比较熟悉的掌控.没有找到完整的rtlinux的api说明...

腾讯通RTX低成本升级解决方案，支持Linux内核国产系统

2301_76417951的博客

12-05

612

作为一款由原RTX技术专家带队开发的即时通讯平台，有度即时通充分继承了RTX的设计优势，并结合企业用户需求进行优化，是一款全面支持国产化和多平台的即时通讯与协同办公解决方案。：RTX仅支持Windows和Mac系统，无法兼容银河麒麟、统信UOS等基于Linux内核的国产操作系统，同时无法在移动设备上使用，对信创推进和办公移动化形成了阻碍。同时，后台支持对已创建群组的直接管理。使用有度即时通提供的RTX迁移插件，自动同步组织架构、群组等数据至有度即时通，无需重新配置，实现低成本、平稳升级。

RuntimeError: CUDA error: no kernel image is available for execution on the device

weixin_51652691的博客

02-28

1026

如果有多个版本的cuda，虚拟环境中指定特定的cuda版本，在/venv/bin/activate中添加自己cuda所在的路径，添加后重新激活虚拟环境。开始使用的cuda版本是10.1，CUDA 10.1 版本不支持 RTX 3080，先升级cuda版本。原因应该是 cuda或pytorch 与显卡算力不区配。2. 配置cuda相对应的环境版本，详情见另一篇博客。1. 将cuda版本升级到11.6。测试：不报错即为配置成功。

rtx有linux安装包吗,Linux中RTX和QQ安装

weixin_29887021的博客

05-13

272

系统版本：Linux Ubuntu12.10-x64安装步骤：1.打开软件中心搜索Wine并安装。2.打开软件中心搜索Winetricks并安装。3.将winetricks中的内容覆盖/home/zhaojian/.cache/winetricks中的东东。3.安装windows依赖包：1 baekmuk colorprofile consolas corefonts droid tahoma g...

8张rtx3080显卡深度学习

最新发布

04-01

### 使用8张RTX 3080显卡进行深度学习的配置与优化 #### 配置环境为了充分利用多GPU的优势，在使用8张RTX 3080显卡进行深度学习时，需要确保硬件和软件环境都已正确配置。以下是几个关键点： 1. **操作系统** 推荐使用Linux发行版（如Ubuntu），因为其对CUDA的支持更加完善，并且在集群管理和并行计算上表现更优。 2. **驱动程序安装** 更新到最新的NVIDIA GPU驱动版本以获得最佳性能和支持最新功能[^2]。可以通过官方文档确认适合当前操作系统的具体驱动版本。 3. **CUDA 和 cuDNN 安装** CUDA 是 NVIDIA 提供的一个通用并行计算平台和编程模型；而 cuDNN 则是一套针对神经网络进行了高度优化的库集合。两者都需要适配所使用的深度学习框架版本。例如 TensorFlow 或 PyTorch 的特定版本可能对应不同的 CUDA/cuDNN 版本需求[^1]。 4. **深度学习框架的选择与部署** 常见的深度学习框架如 TensorFlow 和 PyTorch 已经内置了对于多GPU训练的良好支持。这些工具允许开发者轻松定义数据分布策略以及跨多个设备同步梯度更新的方式。 #### 性能优化建议当拥有如此强大的计算资源时，合理的调参显得尤为重要。这里列举了一些常见的做法来最大化利用这套系统的能力： - **批量大小调整 (Batch Size Tuning)** 多GPU环境下通常会增大batch size从而摊薄每次前向传播所需时间成本。但是过大的 batch size 可能会影响最终收敛精度因此需找到平衡点。 - **混合精度训练 (Mixed Precision Training)** 运用FP16代替传统FP32浮点数表示形式可以在不牺牲太多准确性前提下显著减少内存占用同时加快运算速度。大部分现代框架均提供简单接口实现此特性无需手动修改底层代码逻辑。 - **分布式训练技术的应用** - 数据并行(Data Parallelism): 将整个dataset分割成若干份分别交给各个worker node独立处理后再汇总结果得到全局梯度估计值进而完成参数迭代过程. - 模型切分(Model Sharding/Parallelization): 当单个model过大无法放入单一device memory space里时候可考虑将其拆解开来分配至不同物理位置执行局部子任务最后再组合起来形成完整的预测流程. #### 实际案例分析假设我们正在运行一个基于Transformer架构的大规模自然语言处理项目，则可以按照如下方式组织工作流: ```python import torch from torch.nn.parallel import DistributedDataParallel as DDP def setup(rank, world_size): os.environ['MASTER_ADDR'] = 'localhost' os.environ['MASTER_PORT'] = '12355' # initialize the process group dist.init_process_group("nccl", rank=rank, world_size=world_size) if __name__ == "__main__": WORLD_SIZE = 8 mp.spawn(setup, args=(WORLD_SIZE,), nprocs=WORLD_SIZE, join=True) model = YourModel().to(device) ddp_model = DDP(model) optimizer = optim.SGD(ddp_model.parameters(), lr=0.001) loss_fn = nn.CrossEntropyLoss() for epoch in range(epochs): ... ``` 上述脚本展示了如何借助 `torch.distributed` API 构建起一套简易却高效的DDP方案用于管理八台机器间的协作关系. ---