面向开发者的LLM入门教程(学习笔记01)

关注B站可以观看更多实战教学视频:hallo128的个人空间

面向开发者的LLM入门教程(学习笔记01)

吴恩达老师的《Prompt Engineering for Developer》课程

一、简介

1.LLM的定义

大语言模型(LLM) 的更强大功能是能通过 API 接口调用,从而快速构建软件应用程序

2.分类

(1)基础LLM:是基于文本训练数据,训练出预测下一个单词能力的模型。
(2)指令微调 LLM :通过专门的训练,可以更好地理解并遵循指令。

3.如何训练

指令微调 LLM 的训练通常基于预训练语言模型,先在大规模文本数据上进行预训练,掌握语言的基本规律。在此基础上进行进一步的训练与微调(finetune),输入是指令,输出是对这些指令的正确回复。有时还会采用RLHF(reinforcement learning from human feedback,人类反馈强化学习)技术,根据人类对模型输出的反馈进一步增强模型遵循指令的能力。通过这种受控的训练过程。

指令微调 LLM 可以生成对指令高度敏感、更安全可靠的输出,较少无关和损害性内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值