面向开发者的LLM入门教程（学习笔记01）

最新推荐文章于 2025-02-14 14:32:56 发布

hallo128

最新推荐文章于 2025-02-14 14:32:56 发布

阅读量782

点赞数 6

CC 4.0 BY-SA版权

分类专栏： LLM 文章标签：学习笔记深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43633501/article/details/142332785

LLM 专栏收录该内容

5 篇文章

订阅专栏

关注B站可以观看更多实战教学视频：hallo128的个人空间

面向开发者的LLM入门教程（学习笔记01）

吴恩达老师的《Prompt Engineering for Developer》课程

一、简介

1.LLM的定义

大语言模型（LLM）的更强大功能是能通过 API 接口调用，从而快速构建软件应用程序

2.分类

（1）基础LLM：是基于文本训练数据，训练出预测下一个单词能力的模型。
（2）指令微调 LLM ：通过专门的训练，可以更好地理解并遵循指令。

3.如何训练

指令微调 LLM 的训练通常基于预训练语言模型，先在大规模文本数据上进行预训练，掌握语言的基本规律。在此基础上进行进一步的训练与微调（finetune），输入是指令，输出是对这些指令的正确回复。有时还会采用RLHF（reinforcement learning from human feedback，人类反馈强化学习）技术，根据人类对模型输出的反馈进一步增强模型遵循指令的能力。通过这种受控的训练过程。

指令微调 LLM 可以生成对指令高度敏感、更安全可靠的输出，较少无关和损害性内容。

博客等级

码龄7年

98
原创

695
点赞

593
收藏

463
粉丝

关注

私信

热门文章

分类专栏

sci 7篇
创作
机器人 4篇
扩散模型 9篇
文献阅读 1篇
环境搭建 4篇
kaggle 1篇
LLM 5篇
鲁棒训练 1篇
VP 1篇
SDE 1篇
AI绘画 2篇
C++ 1篇
数据结构 8篇
R 2篇
机器学习 4篇
Python 7篇
数据分析 3篇

展开全部收起

上一篇：: kaggle竞赛（Deepfake检测）的核心流程【notebook 运行演示】

下一篇：: 面向开发者的LLM入门教程（学习笔记02）：提示原则

最新评论

机器人研究不同模态之间的融合方法
征途黯然.: I've learned a lot from this article about 机器人研究不同模态之间的融合方法; it has great depth.
np.concatenate在图像处理中的使用
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
BytesIO使用说明
CSDN-Ada助手: 恭喜用户撰写了第20篇博客《BytesIO使用说明》，内容详实而有深度，让读者受益匪浅。继续努力保持创作的热情与耐心，不断提升自身的写作水平和表达能力。或许下一步可以尝试结合实际案例或者个人经验，让读者更加容易理解和接受，期待您更多精彩的作品！
提取Canny边缘
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Stable diffusion: AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘
CSDN-Ada助手: 恭喜您发布了第19篇博客！看到您在解决Stable diffusion过程中遇到的问题，我感到您的专业知识和解决问题的能力真的令人钦佩。不过，关于AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘的问题，我也稍有了解，或许您可以尝试查找更多相关资料或请教其他专家，以便更快地解决这个问题。期待您的下一篇博客，继续分享您宝贵的经验和见解！加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。