自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1718)
  • 收藏
  • 关注

原创 给想学习LLM方向的同学,分享一些很优秀的大模型开源课程(持续更新)

分享一些很优秀的大模型课程入门开源课程,对转行或者新入门的同学非常友好(个人感受)。

2025-09-12 10:57:20 179

原创 基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)

ollama 专注于在本地设备(如个人电脑或服务器)快速部署和运行开源大语言模型(如 DeepSeek-R1),支持模型下载、环境配置及基础推理服务。

2025-09-12 10:47:58 132

原创 Dify+RAGFlow强强联合打造知识库,大模型入门到精通,收藏这篇就足够了!

就目前而言RAGFlow在知识库方面还是比dify强的,因此如果dify能和ragflow联合使用,那么效果岂不是更强,现在教程来了。

2025-09-12 10:33:30 289

原创 别再跟风了,这才是Agent开发实战指南,大模型入门到精通,收藏这篇就足够了!

作为一名在AI系统领域深耕多年的开发者,我发现唯一真正有效的方法,是按照正确的顺序去理解并攻克一系列核心概念。

2025-09-12 10:32:51 185

原创 使用 DeepSeek R1 和 Ollama 开发 RAG 系统,大模型入门到精通,收藏这篇就足够了!

掌握如何借助 DeepSeek R1 与 Ollama 搭建检索增强生成(RAG)系统。本文将通过代码示例,为你提供详尽的分步指南、设置说明,分享打造智能 AI 应用的最佳实践。

2025-09-11 11:10:29 581

原创 LLaMA Factory 实战—单卡 3 小时训练你的专属大模型!

本文将会带领大家使用 LLaMA Factory 的 Agent Tuning 功能,使用单张 GPU 在 3 小时内训练出自己专属的 LLM Agent。

2025-09-11 11:07:16 517

原创 一文读懂 RAG 与 KAG:原理、工程落地与开源实战(含代码与链接)

一文读懂 RAG 与 KAG:原理、工程落地与开源实战(含代码与链接)

2025-09-11 11:04:53 521

原创 大模型开发实战,使用 LLaMA Factory 微调与量化模型并部署至 Ollama

LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。

2025-09-11 11:03:52 625

原创 【大模型微调】1.LLaMA-Factory简介和基本使用流程,大模型入门到精通,收藏这篇就足够了!

本文先在 windows 操作系统上,跑通LLaMA-Factory的模型微调过程,为后续探索奠定基础。

2025-09-11 11:01:20 422

原创 LLaMA-Factory 一键微调大模型,大模型入门到精通,收藏这篇就足够了!

LLaMA-Factory 是南京大学人工智能创新研究院开源的轻量级大语言模型(LLM)微调工具包。它的设计目标很明确:让普通开发者也能低成本地玩转大模型。

2025-09-11 10:59:55 448

原创 手把手教你快速玩转LLaMA-Factory:大模型微调入门级教程!

对于希望尝试大模型训练的同学来说,从 LLaMA-Factory 入手是一个非常不错的选择!在实际工作中,也经常用到 LLaMA-Factory 进行模型训练。

2025-09-11 10:58:17 658

原创 什么是RAG?一文搞懂检索增强生成技术,大模型入门到精通,收藏这篇就足够了!

LLM训练的数据往往是静态的、封闭的,这使得它们在面对时效性强、专业性高、上下文复杂的问题时,力不从心。

2025-09-11 10:55:15 469

原创 小白也能轻松看懂的RAG,大模型入门到精通,收藏这篇就足够了!

你刚刚入职,准备在公司大展拳脚,让同事们见识一下新人的能力,于是你主动去问领导有没有什么学习资料,领导非常高兴,给了你一大堆祖传文档让你自己去看。

2025-09-11 10:51:42 276

原创 手把手带你使用LangChain框架从0实现RAG

本文将带大家用 LangChain 框架,结合向量数据库,构建一个简易的 RAG 系统,并完成一个端到端的问答任务。

2025-09-11 10:49:35 626

原创 轻量级大语言模型MiniMind源码解读(三):原始Transformer的位置编码及其缺陷

在Transformer原始论文《Attention is All You Need》中,作者使用了固定的正余弦位置编码Sinusoidal PE来为模型引入位置信息。

2025-09-10 10:51:14 286

原创 轻量级大语言模型MiniMind源码解读(二):为什么RMSNorm更适合大模型推理?

RMSNorm是一种简单高效的归一化方法,用于归一化神经网络中某一层的输出,使其数值保持稳定,常用于Transformer中。

2025-09-10 10:49:05 205

原创 轻量级大语言模型MiniMind源码解读(一):如何从头训练tokenizer ?

在这一新的阶段里,我们将结合开源的轻量级大语言模型MiniMind,针对《大模型炼丹术》系列中没有涉及或者浅浅带过的进阶知识点进行详细讲解。

2025-09-10 10:48:36 778

原创 大模型开发实战:(六)在 LangGraph 中使用 MCP 协议,大模型入门到精通,收藏这篇就足够了!

MCP(Model Context Protocol,模型上下文协议)是一种专为大语言模型设计的开源通信协议,使用 MCP 可以标准化模型与外部数据源、工具或服务之间的交互。也就是说通过 MCP 协议,可以使模型具备调用外部工具的能力,比如获取数据、执行外部操作等。

2025-09-10 10:39:39 951

原创 大模型开发实战:(五)使用 LLaMA Factory 微调与量化模型并部署至 Ollama,大模型入门到精通,收藏这篇就足够了!

LLaMA Factory 是一个开源的全栈大模型微调框架,简化和加速大型语言模型的训练、微调和部署流程。

2025-09-10 10:38:45 633

原创 大模型开发实战:(四)使用 LangGraph 实现多智能体应用,大模型入门到精通,收藏这篇就足够了!

LangGraph 提供了一种以图(graph)为核心的解决方案,清晰定义了智能体之间的关系与交互规则,并通过内置的通信接口和协调策略,帮助开发者快速构建高效且可扩展的分布式智能系统。

2025-09-10 10:38:04 560

原创 大模型开发实战:(三)使用 LangGraph 为对话添加历史记录,大模型入门到精通,收藏这篇就足够了!

LangGraph 是 LangChain 生态中一个工具,通过将应用逻辑组织成有向图(Graph)的形式,可以轻松实现对话历史的管理和复杂的对话流程。

2025-09-10 10:37:12 638

原创 大模型开发实战:(二)使用 LangChain 构建本地知识库应用,大模型入门到精通,收藏这篇就足够了!

LangChain 是一个大语言模型(LLM)编程框架,其目的是简化基于大语言模型的应用开发,统一不同大模型的调用方式,开发者无需关心底层 API 差异。

2025-09-10 10:36:28 775

原创 大模型开发实战:(一)使用 Selenium 进行网页爬虫,大模型入门到精通,收藏这篇就足够了!

目前绝大部分 Web 应用都使用 JavaScrip 动态加载数据,而 BeautifulSoup4 只能解析初始页面的 HTML 源码,对于动态加载的数据无法获取,因此使用 Selenium 模拟用户,完成数据加载的操作。

2025-09-10 10:35:31 743

原创 冲击大模型秋招:大模型应用开发岗最强面经

今天来给大家分享一份热乎的大模型应用开发层次的面经,希望能够帮到近期冲击大模型秋招的同学,时间跨度不大,都是近半年面试的,面试公司也涉及了一众大厂,非常具有参考意义~

2025-09-10 10:23:39 682

原创 实打实的数据告诉你:Java转AI大模型应用工程师最佳时机到了!

最近我在各大招聘网站搜索 "AI应用开发"、"智能体开发"、"大模型应用" 等关键词,结果惊呆了 —— 满屏都是15K-60K的高薪岗位,而且大多数明确写着"欢迎Java开发转型"!

2025-09-10 10:22:19 502

原创 基于 ollama 和 Qwen 让模型进行角色扮演和模型破限,大模型入门到精通,收藏这篇就足够了!

我将在本文介绍如何通过 unsloth 框架以 LoRA 的方法微调 Qwen3-14B 模型。

2025-09-09 10:52:48 474

原创 基于 ollama 和 Qwen 让模型进行角色扮演和模型破限,大模型入门到精通,收藏这篇就足够了!

本文介绍一种最简单的让模型扮演指定角色(例如,蒂法)与我们对话的方案,同时也是一种常见的模型破限方式。

2025-09-09 10:52:04 978

原创 3步轻松微调Qwen3,本地电脑就能搞,这个方案可以封神了!【喂饭级教程】

今天给大家带来的是一个带WebUI,无需代码的超简单的本地大模型微调方案(界面操作),实测微调之后的效果也是非常不错。

2025-09-09 10:51:09 722

原创 保姆级Agent(智能体)框架Dify部署流程,大模型入门到精通,收藏这篇就足够了!

Dify是一个开源的LLM的Agent(智能体)应用开发平台,今天咱们详细介绍下Dify的安装步骤和使用场景。

2025-09-09 10:47:35 770

原创 企业级RAG实战:5分钟从零搭建QAnything本地知识库问答系统(附教程)

今天带大家一起搭建一个本地知识库的问答系统 QAnything,QAnything特点的是界面友好,简单易用,知识库管理和问答之外,也提供了 Agent、速读、AI写手等能力。

2025-09-09 10:46:08 909

原创 大模型(Qwen3)训练实战:从零开始玩转LLaMA-Factory,手把手教你打造属于自己的AI助手!

我将为大家详细介绍如何使用LLaMA-Factory这一开源框架,从环境搭建到模型训练,再到实际应用,手把手教你打造属于自己的AI助手!

2025-09-09 10:43:12 969

原创 从零部署Qwen大模型:vLLM实战指南,大模型入门到精通,收藏这篇就足够了!

本文将手把手教你使用高性能推理引擎vLLM部署Qwen大模型,并提供Python和Java两种语言的实现代码,帮助不同技术背景的开发者快速上手。

2025-09-09 10:37:14 747

原创 32B比肩671B,阿里千问QwQ杀疯了!本地电脑就可部署,大模型本地化部署,收藏这篇就足够了!

32B比肩671B,阿里千问QwQ杀疯了!本地电脑就可部署,大模型本地化部署,收藏这篇就足够了!

2025-09-09 10:36:13 599

原创 高级RAG系统:从向量微调到大模型决策,大模型入门到精通,收藏这篇就足够了!

在检索增强生成(RAG)技术飞速发展的今天,我们正见证着一场从“召回主导”到“生成主导”的范式转移。

2025-09-09 10:34:44 777

原创 Spring AI 基于 RAG 构建本地知识库问答助手,大模型入门到精通,收藏这篇就足够了!

在本专栏前面文章,介绍过 LangChain 构建本地知识库问答应用,实现过程也是遵循了上述的流程,整体是基于 Python 实现的方案。

2025-09-09 10:32:03 925

原创 AI应用实战课学习总结(1)必备AI基础理论 ,大模型入门到精通,收藏这篇就足够了!

对于IT系统我是很熟悉的,对于大模型我也算入了个门了,但是对于小模型(通常是指针对某个业务场景的机器学习)我还不够入门,对于Python我也还没怎么用过。

2025-09-08 10:23:43 735

原创 大模型应用开发基础 : 再探提示词工程,大模型入门到精通,收藏这篇就足够了!

所谓提示词工程,就是研究怎么写AI易懂的提示词。为了引导大模型给出更好的答案,提示词工程必不可少,本篇我们再探提示词,看看几个必须知道的技巧。

2025-09-08 10:21:05 625

原创 大模型应用开发基础 : 语言模型的重要里程碑,大模型入门到精通,收藏这篇就足够了!

​本篇我们快速复习一下上一篇的内容再次理解基于统计的语言模型,然后再了解下语言模型发展的重要里程碑。​

2025-09-08 10:19:56 1025

原创 大模型应用开发基础 : 语言模型的关键思路跃迁,大模型入门到精通,收藏这篇就足够了!

我们常常说大语言模型(LLM),那么语言到底是什么?语言是信息的载体,承载着沟通的信息,无论是中文,英文,亦或是甲骨文,没有语言,人与人就无法沟通。

2025-09-08 10:19:08 827

原创 大模型应用开发初探 : 基于Coze创建Agent,大模型入门到精通,收藏这篇就足够了!

最近学习了一门课程《AI Agent入门实战》,了解了如何在Coze平台上创建AI Agent,发现它对我们个人(C端用户)而言十分有用,分享给你一下。

2025-09-08 10:17:54 631

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除