AI小白熊-CSDN博客

原创大模型怎么学？这份爆火教程第二版帮你从入门到进阶

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-06-24 15:19:05 556

原创全网最全！17个RAG进阶技巧，让你的大模型应用强到离谱

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

2025-06-24 15:17:40 574

原创 AI Agent到底是什么？这10个问答让你从“小白”变“内行”

本文通过提取并梳理以上两篇文章中的技术术语和价值信息，并进行扩展，再以问答形式来呈现，希望通过这种方式，在加深使用者和开发者对 AI Agent 的了解方面，起到一些帮助。

2025-06-24 15:08:30 626

原创零基础也能看懂！强化学习入门指南：从RLHF到RLVR全梳理

强化学习（RL）已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习（Agentic RL），你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

2025-06-23 15:37:39 657

原创值得收藏！一篇搞定80+深度学习系统的核心架构（95页超详细综述）

浙大研究了快速发展的深度研究系统领域（Deep Research）——AI驱动的应用通过整合LLM、高级信息检索和自主推理能力，自动化复杂的科研工作流程。

2025-06-23 15:29:45 795

原创 FastGPT 和 Dify 哪个更适合你？一文搞懂两大LLM智能体平台

在大模型智能体快速发展的今天，FastGPT和Dify作为两个最具代表性的开源智能体开发平台。FastGPT专注于知识库问答和RAG场景的深度优化，而Dify则致力于构建基于LLM的Agent智能体应用程序，降低开发门槛，支持多种应用类型。

2025-06-23 15:26:00 778

原创小白也能看懂的MCP工作流程：轻松理解Multi-Agent-Manus！

从（Know-What）到（Know-How）： 1、认知迭代：认知智能体在流程自动化、决策辅助等领域的颠覆性 2、场景淬炼：通过“需求探矿-场景验证-价值量化”三阶模型 3、工程落地：构建Agent的完整技术栈

2025-06-23 15:21:17 507

原创【Dify案例分享】基于文本模型的Fine-tune语料构建工作流实践

AI模型的微调和训练是人工智能领域中非常重要的技术手段，尤其是在大模型时代，这些技术的应用范围和重要性日益增加.

2025-06-22 07:30:00 886

原创图解AI技术架构：开发、训练、部署全流程一看就懂

人工智能（AI）技术的快速发展，使得企业在AI模型的开发、训练、部署和运维过程中面临前所未有的复杂性。从数据管理、模型训练到应用落地，再到算力调度和智能运维，一个完整的AI架构需要涵盖多个层面，确保AI技术能够高效、稳定地运行。本文将基于AI技术架构全景图，深入剖析AI的开发工具、AI平台、算力与框架、智能运维四大核心部分，帮助大家系统性地理解AI全生命周期管理。

2025-06-21 13:58:54 772

原创九张图，搞定AI Agent、LLM、RAG！

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

2025-06-21 13:55:04 768

原创零代码搞定发票管理：用Coze AI智能体批量识别发票，自动填入Excel

Coze工作流是一系列可执行指令的集合，用于实现业务逻辑或完成特定任务。

2025-06-21 13:46:19 859

原创跟AI大厨学微调：轻松掌握定制化大模型的烹饪艺术

从 GPT3 到 ChatGPT、到DeepSeek横空出世，微调在其中扮演了重要角色。什么是微调（fine-tuning）？微调能解决什么问题？什么是 LoRA？如何进行微调？本文将围绕以一个AI厨师的例子，从微调，蒸馏，强化学习之前的关系，微调的分类，实施方案等为大家普及大模型微调的相关知识：文末有厨师照片。

2025-06-21 13:42:12 1006

原创想转行到高薪行业？普通人转行做AI，试试这5步！

你有没有想过，有一天你可以转型成为AI专家，而且还能拿到高薪？

2025-06-20 11:49:54 1006

原创初学者如何对大模型进行微调？看完这一篇你就懂了！

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

2025-06-20 11:48:20 887

原创 RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 **30%。**

2025-06-20 11:46:40 647

原创 AI一本正经胡说？一文彻底搞懂“AI幻觉”成因与解法！

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

2025-06-20 11:27:38 778

原创大模型必看：垂直领域大模型建设路径与实践场景全析

在人工智能发展的浪潮中，大模型技术已经成为推动各行业数字化转型和创新发展的核心驱动力。大模型凭借其强大的语言理解、生成和知识推理能力，展现出巨大的应用潜力。

2025-06-19 14:00:55 644

原创 0基础小白应该怎么开始学习大模型？建议收藏@所有人

想要学习LLM（大型语言模型），首先要对LLM有一定的了解，知道LLM的基本概念和使用。因此，对于每一位初学者，首先都需要学习一些LLM的入门课程，包括基础的 Python 语法（因为 LLM 目前基本都建立在Python生态上）、LLM 的概念、Prompt 书写技巧等，对 LLM 有一个初步而全面的了解。

2025-06-19 13:55:56 748

原创全方位总结大模型技术与趋势：一文详解，看完你就是LLM大师!

本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快，这里对大模型的技术、本质及未来趋势进行总结和探讨时，水平有限，疏漏在所难免，请大家谅解。

2025-06-19 12:02:19 524

原创 AI大模型训练与微调的真正的难点是什么？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

2025-06-19 11:55:31 514

原创一文系统梳理 AI Agent 工程化的核心模块与关键路径

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

2025-06-18 11:51:03 877

原创万字长文深度解析：大模型是怎么被训练出来的？AI大模型落地必读！！！

2025年年初随着DeepSeek的爆火，人们对LLM（Large Language Model，大语言模型）兴趣与日激增，很多人觉得LLM常常显得近乎魔法般神奇。接下来我们就来揭开LLM的神秘面纱。

2025-06-18 11:26:20 876

原创企业级RAG规模化部署的10个关键要点

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

2025-06-18 11:15:26 917

原创从零开始系统掌握 RAG，小白也能轻松入门！

检索增强生成（Retrieval-Augmented Generation, RAG）技术就像是给了这位聪明的学生一个实时搜索引擎。在他回答你的问题之前，他可以先用这个搜索引擎查找最新、最相关的信息。

2025-06-17 11:48:12 769

原创如何解决推理模型过度思考？系统梳理了10篇论文

大模型在复杂推理任务上取得了显著进展，CoT推理过程往往能提升模型回答复杂问题的准确性。然而，过长的链式推理会导致“过度思考”问题：生成冗长而重复的推理步骤，极大增加计算开销和延迟，对简单任务而言更是得不偿失。

2025-06-17 11:27:32 825

原创大语言模型到底是个啥？从零看懂大语言模型（LLM）的本质

本指南介绍了经济学家等社会科学研究者可能会用到的大语言模型知识。本文会覆盖例如模型选择、预处理技术、主题建模和量化分析等方面。并且，为了展示大语言模型在社会科学研究中的具体应用，本文将利用大语言模型的方法，分析美国股价变化的驱动因素。

2025-06-17 11:24:52 931

原创 1小时搞懂Transformer：大模型底层逻辑极简指南

本文以通俗易懂的方式，为“大模型小白”解析Transformer的核心原理，包括其与大模型的关系、自注意力机制、多头注意力机制、位置编码、Encoder和Decoder的组成等内容，帮助读者全面理解这一支撑现代AI的语言模型基石。

2025-06-17 11:21:29 1363

原创五大AI应用构建平台深度对比分析：Dify、n8n、Coze、FastGPT、RagFlow 选型决策框架

这篇文章会从实用角度出发，通过详细的功能对比、真实的使用体验和具体的应用场景，帮助你在Dify、Coze、n8n、FastGPT和RAGFlow这五款主流平台中找到最适合自己的那一个。

2025-06-16 21:06:22 880

原创 AI智能体架构师必备：9大核心技术深度拆解

AI 智能体是一种具备自主意识的软件，它能够感知环境、进行逻辑推理和决策，并实施相应动作。

2025-06-16 21:00:37 886

原创挑战大模型移动端部署：LLM蒸馏落地全流程实战指南

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

2025-06-16 20:55:58 1059

原创 DeepSeek R1训练过程详解：99%开发者忽略的关键细节与工程实践

随着大规模语言模型（LLM）在各类自然语言处理任务中不断突破，如何让模型具备更强的推理能力、生成能力与人类对齐特性，成为研究与工程实践中的重中之重。DeepSeek R1 正是在这样的背景下应运而生，它融合了预训练、监督微调（SFT）、强化学习（RL）及模型蒸馏等多种技术手段，通过分阶段、多轮次的训练迭代，最终构建了一款既具备扎实推理能力，又与人类偏好高度对齐的开源对话模型。在本文中，我们将结合如下流程图（一张纵向展现 DeepSeek R1 训练全貌的思维导图），对训练过程中的每一个模块、每一次迭代都做深

2025-06-16 20:53:23 972

空空如也

空空如也