关于yolov10-DDP训练失败的问题及解决办法(24.6.13)

一、起因经过

       组上叫对比一下用相同的数据训练测试一下yolov10与yolov8各模型的实际情况,一边学习论文,一边安装环境准备跑一下v10的训练。

      虽然提前知道v10是基于v8的某个版本改的,但是运行v10版本时弹出的v8版本号(如图8.1.34)还是有点难绷(有玩v7的时候弹v5版本号内味儿了),甚至运行时还会提示叫你升级v8版本🤣

单卡不报错能直接跑起来,用多卡训练时,DDP报错:

如果你的报错跟我差不多都是DDP命令行显示运行的文件为_temp_开头的临时文件以及报找不到module的错,那你可以往下看了。

二、原因及解决办法

        1.原因是我今日下载下来的v10的代码中使用的还是v8.1.34版本的代码,其开启DDP时的创建ddp命令的类为:可以看到,它在代码中的file时直接生成一个临时的py文件用于分布式训练,位置根据不同的系统放在不同的用户配置文件夹下,linux的会放在如下位置,以及文件内容大概为:

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值