一文看懂大模型热门核心概念:LLM、Prompt、AI Agent、RAG...【建议收藏】

随着 ChatGPT、DeepSeek 等大语言模型的迅速崛起,AI技术已深度融入我们的日常生活与工作场景。对于程序员群体而言,大语言模型在代码生成领域的效率提升尤为显著,拥抱AI技术已成为必然趋势。

那么,究竟什么是大模型?频繁出现的PromptRAGAgent等专业术语又该如何理解?本文将针对大模型及其相关概念进行入门级的介绍,旨在于建立对大模型的基础认知与理解。

1、 基础概念扫盲

在谈到AIArtificial Intelligence,人工智能)时,可能会听到模型、算法、训练、推理等概念。

用一个猫狗分类的例子来简单说明上述概念。例如:给定一张猫或狗的图片,刚出生的小宝宝是无法区分的。

  • 模型:刚出生的小宝宝。
  • 训练:教模型认识猫狗的一个过程。给模型展示大量不同的猫狗的图片,并告诉ta猫狗的不同之处,猫狗的特征是什么,如:猫的尾巴、耳朵,狗的鼻子、体型等等。模型就能根据其学到的知识,来做出区分。
  • 算法:用什么方法来教模型。训练模型时使用的具体方法技术,训练过程中,算法会知道模型如何学习、处理图片特征。
  • 推理:模型学习完毕后,给模型一张新的猫or狗的图片,模型根据学到的知识区分猫狗。模型解题的过程就是推理。
  • 数据集:模型学习的知识。一般分为训练集和测试集,训练集用于训练模型;测试集用于验证模型学习的效果。
  • 参数:参数决定了模型如何根据输入数据生成预测或输出结果。模型本质上是一个函数(比如最简单的 y=wx+b),其中的 w(权重)和 b(偏置)就是模型的参数。通过分析大量数据样本(x, y),模型会自动调整这些参数,使得它能够尽可能准确地拟合数据,找到最能解释输入和输出之间关系的参数值。
  • 泛化能力:模型对于未见过的新数据的预测能力。
  • 过拟合:模型对训练数据学习得过于精确。模型变成了“书呆子”,只会死记硬背,不会融会贯通。
  • 神经网络:模拟人脑认知的分层学习系统,通过不断调整各层"神经元"之间的连接参数,从大量数据中逐步学会区分猫狗,最终能对新数据做出智能判断。

img

2、 关于大模型

2.1 什么是大模型?

大模型(Large Model),或者称为基础模型 (Foundation Model),指的是包含超大规模参数(通常在十亿个以上)的神经网络模型。这些参数使得大模型能够处理和理解复杂的任务,如自然语言处理、图像识别等。

“大” 主要体现在以下几个方面:

  • 参数规模大
  • 架构规模大
  • 训练数据大
  • 算力需求大

以上“大”衍生出模型能力的强大。

我们常说到的大模型,指的是最常用的一类,大语言模型LLM,Large Language Model),如:ChatGPT、DeepSeek等都是大语言模型。

注:本文后续的大模型均代指大语言模型(LLM)

2.2 大模型两大能力

2.2.1 涌现能力

涌现能力Emergent Abilities):训练数据规模及参数数量的提升,大模型解锁了一系列新的能力,如:上下文学习、常识推理、数据运算、代码生成等能力。脑子突然“开窍”了,不再仅仅是复述知识,而是能够理解知识,并且能够发散思维。

2.2.2 泛化能力

泛化能力Generalization Abilities):在面对未见过的新任务、新领域或新数据时,仍能有效完成任务的能力。这种能力使模型不仅限于复现训练数据中的模式,而是能灵活适应多样化场景。

3、 Prompt工程

随着大语言模型(LLM)的出现,提示工程(Prompt Engineering)变得越来越重要。很多人将 Prompt 视为大模型的咒语,其好坏直接影响模型输出的结果。

3.1 什么是Prompt?

Prompt(提示词):发送给大模型的指令,通常以自然语言文本的形式出现。核心目的在于清晰地描述模型应该执行的任务,以引导模型生成特定的文本、图像、音频等内容。

3.2 什么是Prompt工程?

Prompt 提示词很大程度决定生成回答的质量。

Prompt工程Prompt Engineering,提示工程):专注于如何编写Prompt的技术。

一个高质量的Prompt包含以下基本要素:

  • 任务说明

    :向模型明确提出具体的任务要求。任务说明应当清晰、直接,并尽可能详细地描述期望模型完成的任务。

  • 上下文

    :向模型提供的任务相关背景信息,用以增强模型其对任务的理解以及提供解决任务的思路。如:特定的知识前提、目标受众的背景、相关任务的示例等。

  • 问题

    :向模型描述用户的具体问题或需要处理的信息。

  • 输出格式

    :期望模型给出的回答的展示形式。包括输出的格式,以及任何特定的细节要求,如简洁性或详细程度。

img

3.3 如何编写一个好的Prompt

核心技巧:把大模型当人看

3.3.1 编写规范的Prompt

编写规范的Prompt是与大语言模型进行有效沟通的基础。

经典的Prompt通常由任务说明上下文问题输出格式等部分中的一个或几个组成以下是规范编写Prompt需要满足的要求。

3.3.1.1 任务说明要明确

清晰、具体的任务说明能够保证模型准确理解任务要求,产生符合预期的输出。

以下是任务编写的技巧:

  • 使用明确的动词

    :选择能够清晰表达动作的动词。如:“判断”、“生成”等;避免使用模糊的动词,如:“处理”、“操作”等。

  • 具体的名词

    :使用具体的名词来定义任务的输出或目标

  • 简洁明了

    :任务说明应简洁且直接,避免冗长或复杂的句子结构,使模型能够快速抓住任务的核心要求。

  • 结构化布局

    :在较长的 Prompt 中,将任务说明放置在开头和结尾,因为模型通常更关注这些部分的信息。

img

3.3.1.2 上下文丰富且清晰

丰富且清晰的上下文能够显著提升模型的回答准确率。

丰富体现在:内容可以是与问题直接相关的背景信息、具体的演示示例、或是对话历史等。 清晰体现在:上下文信息必须与问题紧密相关,避免包含冗余或是不必要的信息。

img

3.3.1.3 输出格式要规范

规范的输出格式对于确保模型的输出的可用性至关重要。

通过指定明确的输出格式,使模型的输出结构化,便于下游任务直接提取、使用生成内容。或者直接提供输出格式的具体示例,使模型按照期望的输出格式输出内容。

img

3.3.1.4 排版要清晰

  • 使用一致的分隔符:选择并坚持使用一种或集中分隔符来区分不同的prompt部分。如:# - 、 等; 合理使用空白、缩进;增强Prompt可读性,帮助模型区分不同的内容块;清晰的标题和子标题:帮助模型快速识别每个部分的主题;

img

3.3.2 合理归纳提问

  • 复杂问题拆解:将复杂问题拆解成更小、更易于理解的子问题,引导模型逐一回答,确保子问题得到充分考虑和解答。随后将子问题的答案汇总,形成全面回答。
  • 追问:根据回答去做追问。

3.3.3 善用心理暗示

  • 角色扮演:为大模型设定一个详尽的角色。在指令中包含具体属性、职责、知识和技能。

img

  • 情景代入:将特定情境下所需的专业知识、历史背景等信息嵌入到模型的响应中。

img

4、 AI Agent

如果最近有关注科技新闻,一定会被一款名为 Manus 的AI Agent刷屏。Manus一经发布,就引起广泛关注,内测资格甚至一度被炒至高价。到底什么是AI Agent?AI Agent与大模型又是什么关系?

4.1 为什么需要AI Agent?

设想一个场景,我们想要规划一次跨国旅行,涉及到机票的预定、酒店的选择、当地天气以及景点推荐等方面。

如果借助大模型帮助我们规划的话,需要我们自己先思考,将任务拆分成订酒店、订机票、推荐景点等任务,然后我们需要根据拆分好的任务,不断输入任务指令,不断调整,才能完成这件事。任务是交互式的,即通过提示词一步一步来回答问题。

如果有一个智能助手,也就是Agent,我们只需要给出“规划一次跨国旅行”的指令,由助手帮助我们拆解任务、执行任务,不需要我们自己动脑子、做格外的操作,我们只关心助手最终反馈的结果。

总结来说,需要Agent的理由如下:

  • 能够处理复杂任务:单一工具(如:LLM)无法直接完成多步骤、多工具协作的任务;
  • 能够自主决策:=能根据用户偏好(如预算、时间)自动调整计划,例如优先选择低价航班或高评分酒店;
  • 能够弥补大模型的不足:大模型无法直接访问实时数据(如最新航班价格),但Agent可以通过API获取。

4.2 什么是AI Agent?

img

如果查询Agent的中文释义,意思是:代理人,代理商,或是经纪人。

可以将Agent理解为一个中间人的角色,代替别人做事。如:艺人的经纪人帮助艺人去完成商务活动的谈判、对接等工作,无需艺人自己操心,艺人只关心结果。

AI Agent:可以理解为用户和大模型(LLM)之间的中间人,由Agent代替用户去操作大模型。用户只需要给出简单指令,Agent便会自己独立解决问题,而不是“指哪打哪”,整个过程无需用户的干预。

4.2 AI Agent与LLM是什么关系?

Agent = LLM(大模型)+ Planning(规划)+ Memory(记忆)+ Tools(工具)

AI Agent是一种能利用大模型进行自主任务规划决策执行的系统。如果把Agent看作一个人,那么大模型(LLM)就是Agent的大脑

如果说大模型是一本百科全书,而AI Agent就像一个办事能力强的助手。助手会根据需求,把任务拆解成多个步骤,并主动找到资源或工具来完成任务。

Agent关键组成部分如下:

img

规划(PlanningAgent 通过规划来决定如何实现目标,把大任务拆解为子任务,并规划执行任务的流程;并在任务执行的过程中进行思考和反思,决定是继续执行任务,或判断任务完结并终止运行。

记忆(MemoryAgent 拥有的存储器,可用来存储短期记忆或长期记忆。

  • 短期记忆:执行任务过程中的上下文,会在子任务的执行过程产生和暂存,在任务完结后被清空;
  • 长期记忆:如记录使用者的任务历史、个人信息、兴趣偏好等,长时间保留的信息,一般存到外部数据库。

工具(ToolsAgent 的手脚。可以自动调用各种工具API,例如:计算器、搜索工具、代码执行器、数据库查询工具等。有了这些工具API,可以扩展Agent的能力,执行任务。

行动(Action:智能体根据规划的结果采取的实际行动。

总结来说:LLM 扮演了 Agent 的 “大脑”,在 Agent 这个系统中提供推理、规划等能力。

5、检索增强生成(RAG)

5.1 为什么需要RAG?

举个常见的例子:让大模型比较13.8和13.11哪个大,它可能会很自信地告诉你13.11更大。这种明显违背数学常识的回答,暴露了大模型在回答某些问题时,可能会存在一本正经胡说八道的情况。

img

正如上述例子展示的那样,大模型并非无所不能,有些时候会胡言乱语,即产生“幻觉”。可以从两方面去理解幻觉:

  • 模型自身导致的“幻觉”

    大模型实际上是依赖于统计概率来预测下一个最可能的词语,而非基于事实查询。由于训练数据和参数学习上的不足,可能会出现“幻觉”,即生成看似合理实则逻辑混乱或者违背事实的回答。

  • 训练数据导致的“幻觉”

    大模型的回答都是从已有的知识(数据)中学习到的,而知识可能存在以下问题:

  • 知识过时:训练模型时所用的数据是过时的数据;

  • 知识边界:垂直领域或者私有的知识,大模型可能不清楚;

  • 知识偏差:训练数据的正确性无法保证,可能存在错误的知识。

针对大模型存在的“幻觉”问题,可以通过增强检索生成RAG)技术来补足短板,从而提高大模型的回答质量。

5.2 什么是RAG?

RAGRetieval-Augmented Generation,检索增强生成):建立一个外部数据库,将大模型不知道的知识存储在外部数据库中,供大模型进行检索调用,用于提高大模型回答的质量。

用户提问后,根据用户的问题到外部数据库中检索得到上下文context),得到的上下文与用户的问题整合后,作为Prompt提示词送入大模型,供大模型搜索答案。

img

5.3 RAG三大好处

  • 减少大模型的幻觉;
  • 为大模型提供最新的知识,帮助大模型生成质量更高的答案;
  • 相较于模型微调,效率更高 、成本更低。

5.4 RAG工作流程

5.4.1 基础概念扫盲

5.4.1.1 向量嵌入

向量嵌入(Vector Embeddings):将复杂数据(如:图像、文本、音频等)转换为数值向量的过程和结果。向量通常是高维的数字数组,向量中可以体现数据间的语义信息,语义相近的数据向量值接近,在向量空间中距离更近。

例如,给定三个词Cat、kitty、Apple,将这三个词转换为向量,可以看到,语义相近的Cat、kitty向量值比较接近,而Apple与其他词值相差较大,体现在向量空间中,语义相近的词距离更近

img

5.4.1.2 嵌入模型

嵌入模型(Embedding Model):将复杂数据(如:词语、句子或文档)等转换为向量的技术。

img

5.4.1.3 向量数据库

向量数据库(Vector Database):用于存储和检索高维向量数据的数据库,处理与相似性搜索相关的任务,通过语义来搜索。可作为AI的长期记忆库。

向量数据库与传统数据库区别如下:

向量数据库关系数据库
数据类型存储高维向量数据结构化数据
查询方式相似性搜索精确匹配和范围查询
应用场景AI相关管理系统等
代表数据库Milvus、Elasticsearch等MySQL、Oracle等

5.4.1.4 相似性搜索

相似性搜索Similarity Search):利用向量空间中对象间的接近程度来识别和检索相似的对象,这种基于相似度检索的方法,就是相似性搜索。

img

5.4.2 RAG工作流程详解

总体流程可分为四步;

  • 构建外部知识库:针对知识库中各类格式的文档(如:PDF、Word等)进行处理。对知识库中的文档进行分割(Split),将分割后的文本块(Text Chunk)利用嵌入模型转为嵌入向量,存储到向量数据库中。
    文档分割的质量决定了检索的准确性和生成模型的效果。

  • 检索

    Retreive): 将用户输入的问题利用嵌入模型转换为向量,到向量数据库中进行相似性搜索,找到相似度最大的向量,输出为上下文(Context)。

  • 增强

    Augment):上下文与用户问题结合作为提示词(Prompt)送入大模型。

  • 生成

    Generation):大模型根据提示词(Prompt)生成回答,生成的回答返回给用户。

img

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

<think>好的,用户现在想了解大模型相关的概念和专业术语,比如他们提到的“agent”。首先,我需要确定用户的需求层次。他们可能刚开始接触大模型领域,所以需要基础术语的解释,同时提到agent,可能对AI代理相关的内容特别感兴趣。 接下来,我要回忆之前回答过的问题,用户之前询问过模型训练和数据投喂,说明他们对机器学习的基本流程有一定了解。现在需要扩展到大模型的更多概念,这可能包括模型架构、训练方法、应用场景等。 用户可能的目标是理解大模型领域的专业术语,以便更好地阅读相关文献或参与项目。因此,回答需要结构清晰,术语分类明确,每个术语有简明解释,并举例说明。同时,要包含用户提到的agent,并解释其在大模型中的作用。 需要涵盖哪些方面呢?首先是大模型基础概念,比如参数规模、预训练、微调等。然后是架构和技术,如Transformer、注意力机制。接着是训练相关的术语,如分布式训练、混合精度训练。应用方面包括Agent、多模态、提示工程。最后是伦理和安全方面的术语,如对齐、偏见缓解。 要确保术语解释准确,同时用通俗的语言,避免过于技术化。例如,解释Transformer时,可以提到它在处理长文本时的优势,并举GPT和BERT作为例子。对于Agent,说明其自主决策的能力和应用场景,比如AutoGPT。 另外,用户可能对这些术语之间的关系感兴趣,比如预训练和微调的区别,或者Agent如何利用大模型进行任务处理。需要将这些关系在分类中体现,帮助用户构建知识体系。 最后,检查是否有遗漏的重要术语,比如涌现能力、思维链等,这些是大模型特有的现象,对理解模型行为很重要。同时,注意使用中文,避免使用未翻译的英文术语,除非必要,如Transformer通常不翻译。 总结,回答的结构应该是分大类,每类下列举术语,每个术语有定义和例子,必要时用LaTeX公式说明,如缩放定律。保持段落清晰,使用项目符号,帮助用户快速浏览和理解。</think>以下是大模型领域的核心概念和专业术语的系统梳理,包含您提到的Agent概念: --- ### 一、基础概念 1. **大模型(Large Language Model, LLM)** - 参数量超过千亿的神经网络(如GPT-4:$1.8 \times 10^{12}$参数) - 示例:GPT系列、PaLM、LLaMA 2. **涌现能力(Emergent Ability)** - 模型规模突破临界点后突然出现的能力(如复杂推理、代码生成) 3. **缩放定律(Scaling Laws)** 经验公式:$L(N,D) = \frac{200}{N^{0.2}} + \frac{400}{D^{0.5}}$ 描述模型性能($L$)与参数量($N$)、数据量($D$)的关系 --- ### 二、架构与技术 4. **Transformer架构** - 核心组件:多头注意力机制 $$\text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V$$ - 变体:Encoder架构(BERT)、Decoder架构(GPT) 5. **MoE(Mixture of Experts)** - 动态路由机制:输入选择不同专家网络处理 - 典型案例:Google的Switch Transformer --- ### 三、训练方法 6. **预训练(Pre-training)** - 阶段目标:通过大规模无标注数据学习语言模式 - 常用任务:掩码语言建模(MLM)、下一句预测(NSP) 7. **微调(Fine-tuning)** - 公式表示:$\theta^* = \arg\min_{\theta} L(D_{task}; \theta_{pre-trained})$ - 方法对比: - 全参数微调 vs 高效微调(LoRA、Adapter) 8. **强化学习人类偏好(RLHF)** - 三阶段流程:监督微调 → 奖励建模 → PPO优化 --- ### 四、关键应用概念 9. **Agent(智能体)** - 定义:能自主感知、规划、行动的AI实体 - 核心能力链: ``` 感知 → 推理 → 决策 → 执行 → 反思 ``` - 典型应用:AutoGPT(自主完成任务)、MetaGPT(多智能体协作) 10. **提示工程(Prompt Engineering)** - 关键技术: - 思维链(Chain-of-Thought):"让我们逐步思考..." - 少样本学习(Few-shot Learning) 11. **多模态(Multimodal)** - 输入/输出组合:文本+图像+音频(如GPT-4V) --- ### 五、评估与安全 12. **基准测试(Benchmark)** - 常用测试集:MMLU(57学科测试)、HELM(综合评估框架) 13. **对齐(Alignment)** - 目标:使模型行为符合人类价值观 - 方法:宪法AI、红队测试 14. **幻觉(Hallucination)** - 现象:生成看似合理但不符合事实的内容 - 缓解方法:检索增强生成(RAG) --- ### 六、扩展概念 15. **模型服务化** - 关键技术: - 模型量化(8bit/4bit量化) - 服务框架(vLLM、TGI) 16. **开源生态** - 代表性项目: | 类型 | 示例 | |------------|-------------------| | 模型 | LLaMA 2、Falcon | | 微调框架 | HuggingFace PEFT | | 部署工具 | LangChain、LlamaIndex | --- ### 术语关系图谱 $$ \text{预训练} \xrightarrow{\text{微调}} \text{Agent} \xleftarrow{\text{多模态}} \text{提示工程} $$ $$ \downarrow \text{RLHF} \quad \downarrow \text{MoE} $$ $$ \text{对齐} \longleftrightarrow \text{安全评估} $$ 掌握这些概念后,您可以更专业地理解如论文《Scaling Laws for Neural Language Models》等技术文献。需要深入解释某个术语可随时告知。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值