一文搞懂AI Agent原理——李宏毅2025第二讲笔记

鲸鱼在dn

已于 2025-08-17 18:04:09 修改

阅读量960

点赞数 19

CC 4.0 BY-SA版权

分类专栏：大模型机器学习和深度学习基础文章标签：人工智能 chatgpt 语言模型机器学习

于 2025-08-09 19:28:34 首次发布

本文链接：https://blog.csdn.net/qq_41697157/article/details/150112712

机器学习和深度学习基础同时被 2 个专栏收录

18 篇文章

订阅专栏

大模型

8 篇文章

订阅专栏

零、AI Agent 定义与示例

定义

示例

一、Agent关键能力1：如何根据经验调整行为（如何拥有记忆）

1、当模型要解决问题的时候，对于远期的记忆怎么处理？

2、只告诉语言模型怎么做是对的，不要告诉他“不要做什么”

零、AI Agent 定义与示例

定义

人类给定目标，AI自己想办法达成。AI Agent 根据人类的目标（Goal）做出动作（action），影响环境后，agent通过观察调整action。（PS：可能不同的地方，定义不一样）

示例

以alphago为例子：agent的目标是赢棋，通过观察19x19的棋盘，采取动作，选择一个可以落子的地方落子，再观察对手下棋的位置，再落子。但是现在的AI Agent已经跟alphago很不一样了，alphago是用强化学习专门做的下期模型。现在的Agent则可以用文字、图片描述环境，LLM阅读环境信息后直接转译为行动。

从LLM的角度看，Agent一直在做文字接龙——给定目标，观察环境，做出行为，循环观察环境，再做下一步行为。请注意在这堂课程中，没有任何模型被训练。AI Agent举例：让AI使用电脑、用AI训练模型、用AI做研究。且AI Agent 迈向更加真实的互动，比如语音对话，上一个action 还没有执行完，新的对话又来了，那么模型根据输入需要立刻转换行动。

一、关键能力1：如何根据经验调整行为（如何拥有记忆）

1、当模型要解决问题的时候，对于远期的记忆怎么处理？

记忆不能100%的记录下来，不然记忆模块会被无关紧要的小事给填满。解决方案是，用一个write（大模型）决定记录什么记忆。用一个反思模组（大模型）对记忆中的资料做重新整理。read模组（大模型）来确认如何抽取资料。甚至可以为记忆建立知识图谱。
read模组，提取与当次操作相关的信息，输入模型。read 从资料库（长短期记忆）中检索出相关信息，检索方式与RAG一致。
一个小技巧：引导模型得到正确答案，给负面回馈几乎没有用，要给他历史正确的案例，比给他历史错误案例有用得多。
关于GPT记忆的研究还在持续，李老师给了从23年到25年的3篇论文