大模型应用-CSDN博客

原创给想学习LLM方向的同学，分享一些很优秀的大模型开源课程（持续更新）

分享一些很优秀的大模型课程入门开源课程，对转行或者新入门的同学非常友好（个人感受）。

2025-09-12 10:57:20 179

原创基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)

ollama 专注于在本地设备（如个人电脑或服务器）快速部署和运行开源大语言模型（如 DeepSeek-R1），支持模型下载、环境配置及基础推理服务。

2025-09-12 10:47:58 132

原创 Dify+RAGFlow强强联合打造知识库，大模型入门到精通，收藏这篇就足够了！

就目前而言RAGFlow在知识库方面还是比dify强的，因此如果dify能和ragflow联合使用，那么效果岂不是更强，现在教程来了。

2025-09-12 10:33:30 289

原创别再跟风了，这才是Agent开发实战指南，大模型入门到精通，收藏这篇就足够了！

作为一名在AI系统领域深耕多年的开发者，我发现唯一真正有效的方法，是按照正确的顺序去理解并攻克一系列核心概念。

2025-09-12 10:32:51 185

原创使用 DeepSeek R1 和 Ollama 开发 RAG 系统，大模型入门到精通，收藏这篇就足够了！

掌握如何借助 DeepSeek R1 与 Ollama 搭建检索增强生成（RAG）系统。本文将通过代码示例，为你提供详尽的分步指南、设置说明，分享打造智能 AI 应用的最佳实践。

2025-09-11 11:10:29 581

原创 LLaMA Factory 实战—单卡 3 小时训练你的专属大模型！

本文将会带领大家使用 LLaMA Factory 的 Agent Tuning 功能，使用单张 GPU 在 3 小时内训练出自己专属的 LLM Agent。

2025-09-11 11:07:16 517

原创一文读懂 RAG 与 KAG：原理、工程落地与开源实战（含代码与链接）

一文读懂 RAG 与 KAG：原理、工程落地与开源实战（含代码与链接）

2025-09-11 11:04:53 521

原创大模型开发实战，使用 LLaMA Factory 微调与量化模型并部署至 Ollama

LLaMA Factory 是一个开源的全栈大模型微调框架，简化和加速大型语言模型的训练、微调和部署流程。

2025-09-11 11:03:52 625

原创【大模型微调】1.LLaMA-Factory简介和基本使用流程，大模型入门到精通，收藏这篇就足够了！

本文先在 windows 操作系统上，跑通LLaMA-Factory的模型微调过程，为后续探索奠定基础。

2025-09-11 11:01:20 422

原创 LLaMA-Factory 一键微调大模型，大模型入门到精通，收藏这篇就足够了！

LLaMA-Factory 是南京大学人工智能创新研究院开源的轻量级大语言模型（LLM）微调工具包。它的设计目标很明确：让普通开发者也能低成本地玩转大模型。

2025-09-11 10:59:55 448

原创手把手教你快速玩转LLaMA-Factory：大模型微调入门级教程！

对于希望尝试大模型训练的同学来说，从 LLaMA-Factory 入手是一个非常不错的选择！在实际工作中，也经常用到 LLaMA-Factory 进行模型训练。

2025-09-11 10:58:17 658

原创什么是RAG？一文搞懂检索增强生成技术，大模型入门到精通，收藏这篇就足够了！

LLM训练的数据往往是静态的、封闭的，这使得它们在面对时效性强、专业性高、上下文复杂的问题时，力不从心。

2025-09-11 10:55:15 469

原创小白也能轻松看懂的RAG，大模型入门到精通，收藏这篇就足够了！

你刚刚入职，准备在公司大展拳脚，让同事们见识一下新人的能力，于是你主动去问领导有没有什么学习资料，领导非常高兴，给了你一大堆祖传文档让你自己去看。

2025-09-11 10:51:42 276

原创手把手带你使用LangChain框架从0实现RAG

本文将带大家用 LangChain 框架，结合向量数据库，构建一个简易的 RAG 系统，并完成一个端到端的问答任务。

2025-09-11 10:49:35 626

原创轻量级大语言模型MiniMind源码解读（三）：原始Transformer的位置编码及其缺陷

在Transformer原始论文《Attention is All You Need》中，作者使用了固定的正余弦位置编码Sinusoidal PE来为模型引入位置信息。

2025-09-10 10:51:14 286

原创轻量级大语言模型MiniMind源码解读（二）：为什么RMSNorm更适合大模型推理？

RMSNorm是一种简单高效的归一化方法，用于归一化神经网络中某一层的输出，使其数值保持稳定，常用于Transformer中。

2025-09-10 10:49:05 205

原创轻量级大语言模型MiniMind源码解读（一）：如何从头训练tokenizer ？

在这一新的阶段里，我们将结合开源的轻量级大语言模型MiniMind，针对《大模型炼丹术》系列中没有涉及或者浅浅带过的进阶知识点进行详细讲解。

2025-09-10 10:48:36 778

原创大模型开发实战：（六）在 LangGraph 中使用 MCP 协议，大模型入门到精通，收藏这篇就足够了！

MCP（Model Context Protocol，模型上下文协议）是一种专为大语言模型设计的开源通信协议，使用 MCP 可以标准化模型与外部数据源、工具或服务之间的交互。也就是说通过 MCP 协议，可以使模型具备调用外部工具的能力，比如获取数据、执行外部操作等。

2025-09-10 10:39:39 951

原创大模型开发实战：（五）使用 LLaMA Factory 微调与量化模型并部署至 Ollama，大模型入门到精通，收藏这篇就足够了！

LLaMA Factory 是一个开源的全栈大模型微调框架，简化和加速大型语言模型的训练、微调和部署流程。

2025-09-10 10:38:45 633

原创大模型开发实战：（四）使用 LangGraph 实现多智能体应用，大模型入门到精通，收藏这篇就足够了！

LangGraph 提供了一种以图（graph）为核心的解决方案，清晰定义了智能体之间的关系与交互规则，并通过内置的通信接口和协调策略，帮助开发者快速构建高效且可扩展的分布式智能系统。

2025-09-10 10:38:04 560

原创大模型开发实战：（三）使用 LangGraph 为对话添加历史记录，大模型入门到精通，收藏这篇就足够了！

LangGraph 是 LangChain 生态中一个工具，通过将应用逻辑组织成有向图（Graph）的形式，可以轻松实现对话历史的管理和复杂的对话流程。

2025-09-10 10:37:12 638

原创大模型开发实战：（二）使用 LangChain 构建本地知识库应用，大模型入门到精通，收藏这篇就足够了！

LangChain 是一个大语言模型（LLM）编程框架，其目的是简化基于大语言模型的应用开发，统一不同大模型的调用方式，开发者无需关心底层 API 差异。

2025-09-10 10:36:28 775

原创大模型开发实战：（一）使用 Selenium 进行网页爬虫，大模型入门到精通，收藏这篇就足够了！

目前绝大部分 Web 应用都使用 JavaScrip 动态加载数据，而 BeautifulSoup4 只能解析初始页面的 HTML 源码，对于动态加载的数据无法获取，因此使用 Selenium 模拟用户，完成数据加载的操作。

2025-09-10 10:35:31 743

原创冲击大模型秋招：大模型应用开发岗最强面经

今天来给大家分享一份热乎的大模型应用开发层次的面经，希望能够帮到近期冲击大模型秋招的同学，时间跨度不大，都是近半年面试的，面试公司也涉及了一众大厂，非常具有参考意义~

2025-09-10 10:23:39 682

原创实打实的数据告诉你：Java转AI大模型应用工程师最佳时机到了！

最近我在各大招聘网站搜索 "AI应用开发"、"智能体开发"、"大模型应用" 等关键词，结果惊呆了 —— 满屏都是15K-60K的高薪岗位，而且大多数明确写着"欢迎Java开发转型"！

2025-09-10 10:22:19 502

原创基于 ollama 和 Qwen 让模型进行角色扮演和模型破限，大模型入门到精通，收藏这篇就足够了！

我将在本文介绍如何通过 unsloth 框架以 LoRA 的方法微调 Qwen3-14B 模型。

2025-09-09 10:52:48 474

原创基于 ollama 和 Qwen 让模型进行角色扮演和模型破限，大模型入门到精通，收藏这篇就足够了！

本文介绍一种最简单的让模型扮演指定角色（例如，蒂法）与我们对话的方案，同时也是一种常见的模型破限方式。

2025-09-09 10:52:04 978

原创 3步轻松微调Qwen3，本地电脑就能搞，这个方案可以封神了！【喂饭级教程】

今天给大家带来的是一个带WebUI，无需代码的超简单的本地大模型微调方案（界面操作），实测微调之后的效果也是非常不错。

2025-09-09 10:51:09 722

原创保姆级Agent（智能体）框架Dify部署流程，大模型入门到精通，收藏这篇就足够了！

Dify是一个开源的LLM的Agent（智能体）应用开发平台，今天咱们详细介绍下Dify的安装步骤和使用场景。

2025-09-09 10:47:35 770

原创企业级RAG实战：5分钟从零搭建QAnything本地知识库问答系统（附教程）

今天带大家一起搭建一个本地知识库的问答系统 QAnything，QAnything特点的是界面友好，简单易用，知识库管理和问答之外，也提供了 Agent、速读、AI写手等能力。

2025-09-09 10:46:08 909

原创大模型（Qwen3）训练实战：从零开始玩转LLaMA-Factory，手把手教你打造属于自己的AI助手！

我将为大家详细介绍如何使用LLaMA-Factory这一开源框架，从环境搭建到模型训练，再到实际应用，手把手教你打造属于自己的AI助手！

2025-09-09 10:43:12 969

原创从零部署Qwen大模型：vLLM实战指南，大模型入门到精通，收藏这篇就足够了！

本文将手把手教你使用高性能推理引擎vLLM部署Qwen大模型，并提供Python和Java两种语言的实现代码，帮助不同技术背景的开发者快速上手。

2025-09-09 10:37:14 747

原创 32B比肩671B，阿里千问QwQ杀疯了！本地电脑就可部署，大模型本地化部署，收藏这篇就足够了！

32B比肩671B，阿里千问QwQ杀疯了！本地电脑就可部署，大模型本地化部署，收藏这篇就足够了！

2025-09-09 10:36:13 599

原创高级RAG系统：从向量微调到大模型决策，大模型入门到精通，收藏这篇就足够了！

在检索增强生成（RAG）技术飞速发展的今天，我们正见证着一场从“召回主导”到“生成主导”的范式转移。

2025-09-09 10:34:44 777

原创 Spring AI 基于 RAG 构建本地知识库问答助手，大模型入门到精通，收藏这篇就足够了！

在本专栏前面文章，介绍过 LangChain 构建本地知识库问答应用，实现过程也是遵循了上述的流程，整体是基于 Python 实现的方案。

2025-09-09 10:32:03 925

原创 AI应用实战课学习总结（1）必备AI基础理论，大模型入门到精通，收藏这篇就足够了！

对于IT系统我是很熟悉的，对于大模型我也算入了个门了，但是对于小模型（通常是指针对某个业务场景的机器学习）我还不够入门，对于Python我也还没怎么用过。

2025-09-08 10:23:43 735

原创大模型应用开发基础 : 再探提示词工程,大模型入门到精通，收藏这篇就足够了！

所谓提示词工程，就是研究怎么写AI易懂的提示词。为了引导大模型给出更好的答案，提示词工程必不可少，本篇我们再探提示词，看看几个必须知道的技巧。

2025-09-08 10:21:05 625

原创大模型应用开发基础 : 语言模型的重要里程碑,大模型入门到精通，收藏这篇就足够了！

本篇我们快速复习一下上一篇的内容再次理解基于统计的语言模型，然后再了解下语言模型发展的重要里程碑。

2025-09-08 10:19:56 1025

原创大模型应用开发基础 : 语言模型的关键思路跃迁，大模型入门到精通，收藏这篇就足够了！

我们常常说大语言模型（LLM），那么语言到底是什么？语言是信息的载体，承载着沟通的信息，无论是中文，英文，亦或是甲骨文，没有语言，人与人就无法沟通。

2025-09-08 10:19:08 827

原创大模型应用开发初探 : 基于Coze创建Agent,大模型入门到精通，收藏这篇就足够了！

最近学习了一门课程《AI Agent入门实战》，了解了如何在Coze平台上创建AI Agent，发现它对我们个人（C端用户）而言十分有用，分享给你一下。

2025-09-08 10:17:54 631

空空如也

空空如也