- 博客(4)
- 收藏
- 关注
原创 RuntimeError: Error(s) in loading state_dict for DistributedDataParallel报错解决
但是我最后debug出来似乎都不是以上原因,而是因为我在一个网络(假设是net1)中嵌套了一个网络(net2),但是在train文件中,我进行了model.load_state_dict()(这里想要加载的是net1的权重)这时候会可能会把这个权重加载到嵌套中的另一个网络(net2),而不是本身的网络(net1)中,所以我将这两个网络单独定义,然后各自创建实例,加载权重,就解决这个问题了。3.我修改了模型的结构,导致参数加载不匹配,需要在加载时指定一个参数,strict=false。
2024-12-22 23:29:27
520
1
原创 ModelArts平台打卡体验活动-使用mindspore自定义数据集搭建CNN实现猫狗分类
首先mindspore包含了很多图像数据集,很多可以直接用它封装好的函数,不需要自己创建,但是对于自己特定的任务还是需要自己创建的,首先就是设定训练集和验证集的路径,然后用dataset的一个方法GeneratorDataset就可以创建数据集了,这个比较简单,掌握一些OS库的基本操作就可以,对于文本文件的读取可以用mindspore封装好的LineReader方法,可以很方便的读取文本信息。接着是训练和验证逻辑的实现,mindspore中是把这两个过程封装成了一个对象,类似于一个修饰器?
2024-12-08 23:37:14
359
原创 基于MindSpore的SGD优化器实现-体验过程记录
MindSpore框架中的SGD优化器,通过结合动量、阻尼、Nesterov动量和梯度中心化等多种优化技术,旨在提高模型训练的效率和性能。在训练的过程中,我尝试使用GPU进行训练加速,因为用GPU训实在太慢了,平均一个epoch要30多秒,我下载了能够支持cuda10.1和10.6的mindspore2.2.4版本,同时设置了上下文为GPU环境,但是还是报错了,可能是因为我的cuda是11.6版本的,但是它难道不会向下兼容吗,这是我在这个体验过程中的一个困惑。
2024-12-08 23:28:12
330
原创 香橙派5B-RK3588-NPU内核更新至0.9.6
今天在看rkllm的手册时,发现要求板端的NPU内核版本至少要0.9.6,手册里面说的看的不是很懂,不知道要下载哪一个固件,好在上网找了一些资料后终于成功了。具体目录如上,这里有两个deb包,根据你Linux的内核版本下载对应的deb包,我的是current分支的。,但是比较麻烦,其实可以直接在板端的Ubuntu操作系统上进行更新。到官方网站下载Orangepi5B的固件。可以查看Linux内核版本。
2024-07-06 23:16:38
1989
5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人