【LLM】Prompt tuning大模型微调实战

山顶夕景

已于 2023-09-03 14:01:26 修改

阅读量1w

点赞数 23

CC 4.0 BY-SA版权

分类专栏：自然语言处理深度学习 LLM大模型文章标签：模型微调 prompt tuning 大模型

于 2023-07-10 21:48:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35812205/article/details/131647749

自然语言处理同时被 3 个专栏收录

89 篇文章 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

148 篇文章

订阅专栏

135 篇文章

订阅专栏

note

prompt tuning可看做是prefix tuning的简化版本，在输入层加入prompt tokens，并不需要加入MLP进行调整来解决难训练的问题，作者实验表明随着预训练模型参数量的增加，prompt tuning效果逼近fine tuning效果

文章目录

note
一、Propmt tuning
二、Prompt tuning代码实战
Reference

一、Propmt tuning

1. peft库中的tuning

之前提到过可以借助peft库（Parameter-Efficient Fine-Tuning）进行微调，支持如下tuning：
- Adapter Tuning（固定原预训练模型的参数只对新增的adapter进行微调）
- Prefix Tuning（在输入token前构造一段任务相关的virtual tokens作为prefix，训练时只更新Prefix部分的参数，而Transformer的其他不分参数固定，和构造prompt类似，只是prompt是人为构造的即无法在模型训练时更新参数，而Prefix可以学习<隐式>的prompt）
- Prompt Tuning（Prefix Tuning的简化版，只在输入层加入prompt tokens，并不需要加入MLP）
- P-tuning（将prompt转为可学习的embedding层，v2则加入了prompts tokens作为输入）
- LoR

了解本专栏

超级会员免费看

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

山顶夕景 小哥哥给我买个零食可好

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。