pytorch模型和数据已经导入到gpu上，训练速度没有提升

最新推荐文章于 2024-12-27 15:38:18 发布

原创

最新推荐文章于 2024-12-27 15:38:18 发布 · 884 阅读

·

9

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#pytorch #人工智能 #python #深度学习 #机器学习

文章讨论了在使用预训练Bert进行分类任务微调时，尽管GPU资源几乎满载但训练速度未提升的问题。解决方法是将模型和优化器状态从checkpoint加载，而非作为函数参数传递。通过将操作移到函数内部，训练速度显著提升至每秒9个迭代。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述：如题，在用预训练Bert进行分类微调时，用nvidia-smi看显存占用和gpu使用率都接近全满，但是速度和在cpu上训练是一样的。

torch.manual_seed(0)
a=CustomDataset(query_dic=data,table_dic=data2,batch_size=4,tokenizer=tokenizer)
checkpoint = torch.load('model_checkpoint0.pth')
model = classifier(cwd + bert_path, 7)
optimizer = optim.Adam(model.parameters(), lr=5e-6)
model.load_state_dict(checkpoint["net"])
optimizer.load_state_dict(checkpoint["optimizer"])
start_epoch=checkpoint["epoch"]
run(1,a,model,optimizer,start_epoch)

首先实例化模型和优化器，加载checkpoint，将模型、优化器和数据集传入到训练函数run中。

函数run的代码如下：

def run(epochs,data_iter,model,optimizer,start_epoch):
    device=torch.device("cuda")

    model.to(device)#将模型转移到gpu上
    criterion=torch.nn.CrossEntropyLoss(ignore_index=10)

    for state in optimizer.state.values():  ##将cpu上的optimizer参数转移到gpu上
        for k, v in state.items():
            if isinstance(v, torch.Tensor):
                stat

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄4年

5
原创

41
点赞

25
收藏

27
粉丝

关注

私信

热门文章

下一篇：: 书生·浦语大模型第一节课笔记

最新评论

pytorch模型和数据已经导入到gpu上，训练速度没有提升
草履虫-.-: 原因已找到：显存OOM导致训练只有cpu的效率。OOM的原因是在函数run外部我们创建了model实例，同时又将实例传入到了函数里，在函数运行过程中，会开辟内存空间接收传入的model实例，而外部的model实例所占内存并没有被释放，所以我们相当于将二倍的模型大小导入到了显存中，当然就OOM了（我的4g笔记本显卡听后瑟瑟发抖）。
书生大模型第二节课笔记
CSDN-Ada助手: 恭喜用户在书生大模型的第二节课上做了详细的笔记！持续创作是一个不断进步的过程，你已经展现了很好的学习态度和记录能力。接下来，建议你可以尝试将课堂笔记与自己的思考结合起来，加入一些个人见解和感悟，这样会使你的博客内容更加丰富和有深度。期待看到你更多精彩的作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
书生大模型第二节课作业
CSDN-Ada助手: 恭喜您完成了第四篇博客“书生大模型第二节课作业”！持续创作是非常了不起的事情，您的努力和热情让我们看到了您的专注和执着。希望您在未来的创作中能够保持这样的热情和创作力，不断提升自己的写作水平。或许可以尝试更多不同的题材和风格，挑战自己的创作技巧，让读者们在阅读您的博客时有更多的惊喜和启发。期待您更多精彩的作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
书生·浦语大模型第一节课笔记
CSDN-Ada助手: 太棒了！看到你分享的这篇博客，我对书生浦语大模型有了更深入的了解。希望你能继续分享更多关于这个领域的知识，让更多人受益。另外，如果你想进一步拓展自己的技能，可以尝试学习自然语言处理（NLP）的相关知识，这将有助于你更好地理解和应用大型语言模型。祝你在写作的道路上越走越远！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。