241124_基于MindSpore学习Prompt Tuning

最新推荐文章于 2025-08-13 21:06:14 发布

xiandong20

最新推荐文章于 2025-08-13 21:06:14 发布

阅读量788

点赞数 5

CC 4.0 BY-SA版权

分类专栏：昇思学习文章标签：学习 prompt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_66378701/article/details/144011185

昇思学习专栏收录该内容

39 篇文章

订阅专栏

241124_基于MindSpore学习Prompt Tuning

传统的NLP训练模式都是先在大量的无标注的样本上进行预训练，然后再使用有标注的样本进行有监督的训练，调整单一的线性成果而不是整个模型。

但在实际训练中发现，如果模型参数过大，在Fine Tune阶段成本较高。就是每次都要在一个参数很大的模型上进行微调。

于是产生了NLP的第四范式：不做Fine Tune，模型无监督训练好了就不改变了，而是给一些prompt

比如我要做一个情感分类，就先告诉他这是一个情感分类任务，然后再给具体任务

bert就是使用pre train和fine tune的模型，实现的目标是做类似于完形填空的任务和上下文联系任务

fine-tuning：通过改变模型结构，使模型适配下游任务

prompt learing：模型结构不变，通过重构任务描述，使下游任务适配模型

Prompt-Tuning步骤：

使用一个情感分类任务举例

构建模板：这一步是做完形填空的过程，比如I love this movies,拼接到原始文本中，获得Prompt-Tuning的输入：[I love this movies. overall, it was a [mask] movie]。这一步给模型模型就需要去填这个mask 的答案，模型会填进去很多可能的答案，每个答案对应一个分数，分数最高的是最后的答案。

标签词映射：在模型给出答案之后，比如模型给了个greet，因为我们是个情感分类任务，想要得到的结果只是两种，我们就要建立greet到positive的映射。如果是terrible，则认为是negative类。

Prompting中最主要的两个部分是template与verbalizer的设计

template可以基于任务类型和预训练模型选择（shape）或生成方式(huamn effort)进行分类

打卡截图：

博客等级

码龄4年

79
原创

989
点赞

926
收藏

716
粉丝

关注

私信

热门文章

分类专栏

上一篇：: 241124_基于MindSpore学习GPT2

下一篇：: 241124_文本解码原理

最新评论

241015_把一个文件夹中的所有图片按照序列命名
杨明栋: 生成的图片会乱序，好像
240929-CGAN条件生成对抗网络
aftertime_: 作者学的很认真
基于wxPthon所做的GUI桥梁数据监测管理项目（一）前言
CSDN-Ada助手: 恭喜您开始博客创作！标题中提到的基于wxPython的GUI桥梁数据监测管理项目听起来非常有趣。作为读者，我期待着您能够进一步详细介绍这个项目的前言部分。希望您可以分享一些关于选择wxPython的原因以及在项目中所遇到的挑战和解决方案。同时，如果您能提供一些关于GUI设计和数据监测管理的实践经验，将会让我们受益匪浅。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
基于wxPthon所做的GUI桥梁数据监测管理项目 (二) 登陆界面开发
CSDN-Ada助手: 很棒的文章！看到你不断学习和研究GUI桥梁数据监测管理项目，真的很让人钦佩。除了Layout-wxBoxSizer，你还可以尝试使用其他布局组件，比如wxGridSizer和wxFlexGridSizer，它们也能实现复杂的布局设计。另外，你还可以学习一些关于界面美化和用户体验的知识，比如添加图标、使用颜色和字体等，这些都能让你的项目更加吸引人。期待你继续分享更多的成果，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
基于wxPthon所做的GUI桥梁数据监测管理项目（三）主界面及对excel、mysql数据库的操作
CSDN-Ada助手: 恭喜您写了第三篇博客！标题看起来非常吸引人，不仅介绍了基于wxPython所做的GUI桥梁数据监测管理项目的主界面，还包括对excel和mysql数据库的操作。这个项目听起来非常有实用性和技术挑战性。您的博客内容非常详细，让读者对项目有了更深入的了解。我非常期待看到您在下一篇博客中继续分享更多关于这个项目的内容。或许您可以介绍一下项目中的一些具体功能实现，或者分享一些在开发过程中遇到的挑战和解决方案。希望您继续保持写作的热情，坚持分享您的学习和经验。再次恭喜您，期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。