- 博客(870)
- 收藏
- 关注

原创 DeepSeek R1 671B 完整版本地部署教程来了!!!
关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。然而,完整的671B MoE模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台Mac Studio)上运行。那么,如何用 ollama 在本地部署 DeepSeek R1 671B(完整未蒸馏版本)模型呢?一篇在海外热度很高的简明教程即将揭晓。作者主页:https://snowkylin.github.io。
2025-02-05 16:12:23
12005
1

原创 深入浅出 AI 智能体(AI Agent)|技术干货
随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。智能体(英文名:AI Agent 或 AI Bot)是指能够感知其环境并采取行动以实现某种目标的实体。
2025-01-04 17:14:34
23677
1

原创 五款国产AI大模型大测评!Kimi,智谱清言,通义千问,文心一言,豆包谁更胜一筹?
AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。原理主要基于深度学习技术,特别是神经网络和大规模数据的训练,它们通过分析大量数据来学习语言模式、知识表示和任务执行策略。AI大模型的训练过程通常包括以下几个步骤:数据预处理:对原始数据进行清洗、整理和标注,包括去除噪声、填充缺失值、归一化等操作;模型构建:设计并搭建神经网络,这包括确定网络的层次结构、神经元数量、激活函数等;模型训练:将预处理后的数据输入到神经网络中,不断调整神经元的连接权重使模型达到满意的性能;
2024-10-28 11:26:42
48851

原创 Ollama:一个在本地部署、运行大型语言模型的工具
所谓自定义模型就是不适用Ollama官方模型库中的模型,理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手,你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统,支持各类大模型。这里使用Docker快速进行部署。拉取镜像创建挂载目录启动容器访问IP:3001初始账号用户名为 root,密码为 123456。
2024-05-28 10:30:57
7976

原创 【大模型实战案例】手把手教大家微调大模型 Llama 3
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,我们对 Llama 3 进行了微调!!!今天手把手教大家使用 XTuner 微调 Llama 3 模型。
2024-04-23 18:09:27
4624
2

原创 OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了
这个技巧偏开发者。普通用户可以跳过。因为模型具有固定的上下文长度,因此用户和助手之间的对话无法无限期地继续。解决此问题有多种解决方法,第一个是总结对话中的历史记录。一旦输入的大小达到预定的阈值长度,这可能会触发总结部分对话的查询,并且先前对话的摘要可以作为系统消息的一部分包括在内。或者,可以在整个对话过程中在后台异步总结之前的对话。这两种方法都行,或者还可以把过去的所有聊天记录存成向量库,后续跟用户对话的时候动态查询嵌入,也可以。
2024-04-10 10:42:26
12692
原创 大模型 Token 分词 + 词向量:一篇吃透核心原理与应用,看完就懂!
大模型 Token 分词 + 词向量:一篇吃透核心原理与应用,看完就懂!
2025-07-26 14:53:23
1039
原创 非技术背景也能入行 AI?9 个高薪爆岗实操指南,简单易上手(含收藏级攻略)
非技术背景也能入行 AI?9 个高薪爆岗实操指南,简单易上手(含收藏级攻略)
2025-07-26 14:49:13
756
原创 AI 产品核心术语精解:通俗解读 + 场景对照,一文吃透上手即用
在当今数字化时代,AI 产品如潮水般涌入我们的生活,从智能语音助手到图像识别软件,从推荐算法到自动驾驶技术,AI 无处不在。然而,对于许多非专业人士来说,AI 领域的众多术语犹如一道道难以跨越的门槛,让人望而却步。本文旨在用通俗的语言解读 AI 产品的核心术语,并结合实际场景进行对照,帮助读者轻松理解并能在实际中运用这些知识。
2025-07-24 14:44:40
673
原创 【超全指南】GraphRAG 从入门到精通:一篇吃透所有细节,建议收藏!
【超全指南】GraphRAG 从入门到精通:一篇吃透所有细节,建议收藏!
2025-07-20 11:00:00
920
原创 产品经理入门指南:从 0 到 1 的学习路径 + 必看书籍 + 优质课程 + 实用网站推荐,少走弯路看这篇就够了!
产品经理入门指南:从 0 到 1 的学习路径 + 必看书籍 + 优质课程 + 实用网站推荐,少走弯路看这篇就够了!
2025-07-18 14:54:43
729
原创 又到毕业季,想入行AI的朋友注意:AI产品经理面试必刷50题!附完整答案和避坑指南!
又到毕业季,想入行AI的朋友注意:AI产品经理面试必刷50题!附完整答案和避坑指南!
2025-07-15 15:55:29
1021
原创 检索增强生成 (RAG) 详解:组成与作用原理,一篇文章讲明白
大语言模型(LLM)凭借其强大的文本生成能力,在聊天机器人、内容创作、智能问答等众多领域大放异彩。然而,这些模型也存在一些难以忽视的短板,比如可能生成与事实不符的内容(幻觉)、对最新信息的掌握不够及时、在处理特定领域专业知识时表现欠佳等。为了弥补这些缺陷,检索增强生成(RAG)技术应运而生。下面,我们就来详细解读 RAG 的组成部分和作用原理。
2025-07-11 15:56:25
681
原创 【2025 最全】人工智能学习路线:新手与大学生适用的完整指南,一篇搞定!
【2025 最全】人工智能学习路线:新手与大学生适用的完整指南,一篇搞定!
2025-07-11 15:48:55
845
原创 一文搞清楚RAG的5步流程和12个优化策略,看这一篇就够了!
本文将详细解析 RAG 的 5 步流程和 12 个优化策略,助你全面掌握这一实用技术。
2025-07-10 14:33:55
849
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人