- 博客(841)
- 收藏
- 关注

原创 在个人电脑上运行Llama 3 70B大规模模型指南
随着人工智能和机器学习技术的迅猛发展,像Llama 3 70B这样的庞大语言模型已经成为了研究、开发和应用中的重要工具。这篇文章将详细介绍如何在个人电脑上运行Llama 3 70B大模型,并涵盖硬件要求、软件环境配置、安装步骤、运行示例和常见问题的解决方案。虽然运行这样一个大规模的模型在性能上有限制,但对于实验和学习非常有帮助。
2024-06-15 10:35:11
7751

原创 2024!国内AI大模型平台哪家强?全方面测评来了
这篇仅是开坑哈,后面会持续更新的~主旨就是想要在滚滚浪潮中帮助AI开发者发现、汇聚到简单、好用的AI大模型平台&开发者社区上来,共建国内繁荣AIGC生态!!有些规模太小、不好用、吃相太难看(没几个模型就要走付费变现路子的)的平台我就先不放上来啦。
2024-06-05 17:14:02
7736

原创 如何学习训练大模型——100条建议(附详细说明)_如何训练自己的大模型
通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步积累经验,最终能够处理大模型和复杂任务。分享您的研究成果和代码,以获得反馈和建立声誉。
2024-04-17 11:56:47
7383

原创 AI 入门,从零搭建完整 AI 开发环境,并写出第一个 AI 应用
在本文中,我们从零开始,一步步搭建了一个完整的AI开发环境,并创建了一个简单的AI应用。您学习了如何安装Python、Anaconda、TensorFlow,以及如何使用Jupyter Notebook进行开发。通过这个简单的手写数字识别应用,您不仅学习了AI的基本概念,还亲身体验了AI的应用。AI是一个广阔而充满机遇的领域,希望这个教程能够激发您继续深入学习和探索AI的兴趣。
2024-04-10 11:02:43
11298
1

原创 国内超大型智能算力中心建设白皮书 2024
智算中心建设通过领先的体系架构设计,以算力基建化为主体、以算法基建化为引领、以服务智件化为依托,以设施绿色化为支撑,从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构(一)总体架构图8 智算中心总体架构智能算力中心建设白皮书,重点围绕基础、支撑、功能和目标四大部分,创新性地提出了智算中心总体架构。其中,基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构;支撑部分围绕智算中心算力生产、聚合、调度、释放的作业逻辑展开;功能部分提供算力生产供应、数据开放共享、智能生态建设和产业创
2024-04-08 15:07:31
10851
1
原创 想入门大模型?AI 大模型时代的人才画像:这些岗位核心能力,你是否已具备?
想入门大模型?AI 大模型时代的人才画像:这些岗位核心能力,你是否已具备?
2025-07-08 15:54:42
864
原创 【入门者必备】一文详解主流 RAG 技术框架概览及对比详解,看这一篇就够了!
【入门者必备】一文详解主流 RAG 技术框架概览及对比详解,看这一篇就够了!
2025-07-08 15:39:29
445
原创 LlamaIndex开发全解析:从知识管理到应用实战,看这一篇就够了!
LlamaIndex 是一个专为大语言模型(LLM) 设计的开源数据框架,核心目标是构建高效的检索增强生成(RAG) 系统。它通过结构化数据索引和智能检索机制,帮助开发者将私有数据与LLM结合,解决大模型知识时效性不足和领域适应性差的问题。
2025-07-07 14:45:22
644
原创 提示工程(Prompt Engineering)最全综述:本质、技术、最佳实践,看这一篇就够了!
提示工程(prompt engineering),简而言之,是构建和优化输入提示以引导LLMs生成准确且富有洞察力的输出的艺术和科学。在LLMs的世界里,一个精心设计的提示就如同一位经验丰富的向导,能够引领模型穿越复杂的信息海洋,找到用户心中的答案。
2025-07-07 14:37:05
755
原创 搭建个人知识库:借助 WSL 和 Ollama 部署本地 DeepSeek 模型并与 VSCode 集成
本文将记录并分享在WSL中通过Ollama和CherryStudio搭建本地大模型,以及将本地模型集成到VsCode的AI助手的具体过程。
2025-07-06 10:00:00
1187
原创 SFT 是什么?大模型SFT(监督微调)该怎么做(经验技巧+分析思路)
SFT(Supervised Fine-Tuning) 是监督微调的缩写,主要用于计算机科学领域,特指在预训练模型(如大语言模型)基础上,通过少量标注数据调整模型参数,使其适应特定任务的技术。
2025-07-04 11:30:01
889
原创 大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略
Ollama 是一个开源的本地大模型部署工具,旨在简化大型语言模型(LLM)的运行和管理。通过简单命令,用户可以在消费级设备上快速启动和运行开源模型(如 Llama、DeepSeek 等),无需复杂配置。它提供 OpenAI 兼容的 API,支持 GPU 加速,并允许自定义模型开发。
2025-07-04 11:23:25
820
原创 【干货分享】从FiDRAG到GraphRAG,一文带你了解RAG选型终极指南
本文选择了十大最值得关注的RAG工具,以及一个实用的评估框架,我们可以根据自身需求选择最合适的 RAG框架。
2025-07-03 13:58:32
1022
原创 35岁程序员转行AI - 岗位选择、学习路径及全景知识图谱【建议收藏】
本文将从程序员转行AI的优劣势入手,详细分析适合的岗位、系统化的学习路径,并提供全景知识图谱,助你高效规划转行路线。
2025-07-02 13:57:59
704
原创 大白话带你了解:智能体、LLM、RAG和提示词工程,轻松构建下一代应用
这两年AI应用开发火得不行,但很多小伙伴被一堆专业名词绕晕了。今天咱们就来掰开揉碎说说几个最关键的术语,保证看完你就能和工程师聊上两句了。
2025-07-02 13:50:22
1061
原创 想要训练私有化AI大模型,那你一定要会用RAG!
RAG检索增强生成(Retrieval-Augmented Generation )是一种结合大语言模型(LLM)与外部知识库的技术,通过动态检索相关外部信息辅助模型生成更准确、可解释的答案。
2025-07-01 14:01:17
558
原创 AI 落地企业 70 问:从入门到避坑,一篇搞定所有难题
为此我们整理了 70 个 AI 在企业落地应用的实战常见问题,从认知、基础、成本、组织、AI 技术选型到落地实现,为您提供一份全面的 AI 落地指南。无论你是企业管理者、技术负责人,还是对 AI 感兴趣的从业者,都能从中找到答案。
2025-06-30 15:04:23
1541
原创 想借助AI智能体创业?这100个问题清单你一定要搞清楚!(建议收藏)
在AI智能体领域开启创业征程,尤其是面向C端用户时,你是否也被这些困惑所困扰?
2025-06-28 15:28:06
759
原创 Agent智能体和workflow工作流是一回事吗?如果不是那么它们的区别是什么?
Agent智能体和workflow工作流是人工智能领域非常重要的两个概念,很多人弄不清楚智能体和工作流的区别,甚至会认为它们是一回事。所以,今天我们就来讨论一下智能体和工作流的区别与联系。
2025-06-28 15:24:07
708
原创 一文带你 “看见“ MCP 的过程,彻底理解 MCP 的概念
说实话,当我看到使用 MCP 服务还需要手动复制粘贴 JSON 的时候,包括现在很多 MCP 服务只有工具,没有资源和提示时,我认为 MCP 还不太成熟。
2025-06-27 11:55:25
937
原创 一文讲清楚工业领域中 “大模型 + 知识图谱” 落地应用的四大典型场景
人类有两种主要的思维模式,一种是快速而直觉的,另一种是缓慢而深思熟虑的,这种说法起源于并广泛存在于古老的哲学和心理学著作中。通常用“系统 1 ”和“系统 2 ”来表示以上两种类型的认知过程,诺贝尔奖获得者心理学家丹尼尔·卡尼曼(Daniel Kahneman)在其著作《思考,快与慢》中详细介绍了两种认知系统的区别之处,系统 1 是直觉性、快速、大容量、并行、无意识、情境化和自动化的,其依赖情感、记忆和经验迅速作出判断,是类似于动物认知的内隐知识;系统 2 则是分析性、缓慢、有限容量、串行和抽象的,其受到规则
2025-06-26 11:35:35
765
原创 AI概念解析:从入门到精通的36个关键术语指南
随着AI的普及和快速发展,越来越多的人开始关注AI,但是深奥晦涩的专业术语,让很多人望而却步,甚至对于人们应用AI产生了一定困难。因此,社区决定对AI领域的热点概念和专业术语进行解读,并配备相应图表以便于大家更形象的理解。我们将从七大方面进行深度解读,方便大家能够更好的进入该领域学习和应用。
2025-06-26 11:28:24
744
原创 非技术背景,如何转型 AI 领域?这 9 大热门高薪岗位其实比你想象中更容易入手!建议即刻收藏!
今天推荐的这些AI岗位,很多并不要求你有技术背景,只要你有“学习能力+业务理解力+好奇心”,结合你之前的经验,也完全可以切入其中。
2025-06-25 14:23:08
557
原创 大语言模型(LLM)是什么?大语言模型(LLM)综述,看这一篇就够了!
前段时间无意中刷到了Andrej Karpathy大神的视频(Deep Dive into LLMs like ChatGPT)。这是我看过的最好LLM讲解视频,我最欣赏的一点就是Andrej大神在讲解抽象概念时,会给出生动具体的例子,即便是像我这样对编程一窍不通的小白,也能看懂其中的关键概念。视频全长三个半小时,强烈建议对LLM有兴趣的同学观看。
2025-06-24 11:36:39
795
原创 2025年最热门岗位: AI产品经理,稳定且高薪!再不入局就晚了
在21世纪第三个十年的中期,职场环境正经历着前所未有的变革,技术的飞速进步与全球市场的快速迭代,让职业选择成为一个需要深思熟虑的决定。对于那些渴望在稳定与高薪之间找到完美平衡点的求职者而言,选对赛道至关重要。而在众多新兴职业中,AI产品经理以其独特的魅力,成为了2024年最火的职业之一,不仅展现了强劲的发展势头,还为从业者提供了可观的薪酬回报和相对宽松的竞争环境
2025-06-24 11:35:21
743
原创 一文带你了解大模型——智能体(Agent)|技术干货
随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。
2025-06-23 14:10:13
1268
原创 从 AI 产品经理到大规模模型产品经理:零基础转型指南及高薪进阶路径(附 2025 年全新学习地图)
在当今科技飞速发展的时代,人工智能(AI)已经不再是一个遥远的概念,它正深刻地改变着我们的生活和工作方式。随着大模型技术的崛起,AI 领域迎来了新的发展浪潮。作为连接技术与业务的关键角色,AI 产品经理的重要性日益凸显。而在这其中,大模型产品经理更是成为了行业内炙手可热的职位。那么,如何从一名普通的 AI 产品经理转型成为大模型产品经理呢?本文将为你提供一份零基础转型指南,并揭示高薪进阶路线,同时附上 2025 最新学习地图,助你在这个充满机遇的领域中实现职业飞跃。
2025-06-23 14:05:05
1130
原创 2025人工智能爆发,报什么专业才不被淘汰?零基础入门到精通,看这篇就够了!赶紧收藏!
2025春节期间,Deepseek和宇树科技的机器人火爆出圈,让很多普通人切身感受到人工智能已经袭来。尤其是Deepseek,甚至有文章说“Deepseek能让张雪峰都失业”。
2025-06-21 14:27:51
843
原创 AI智能体(Agent)是什么?(非常详细),零基础入门到精通,看这一篇就够了
在2018年的开发者大会上,谷歌宣布的一款 AI 助手——Google Duplex,一个通过电话完成实际任务的人工智能系统。它能够进行复杂的对话,并且 完全自主 地完成大部分任务,无需人工参与。当然它也具备自我监控功能,当识别到无法自主完成任务时(例如,安排异常复杂的约会),它会向可以完成任务的人类操作员发出信号 。
2025-06-21 14:24:03
859
原创 2025程序员转行大模型领域的方向推荐,这五个方向最有发展前景!!
在科技变革的浪潮中,大模型技术已成为推动各行业创新发展的核心驱动力。对于程序员而言,这既是一场挑战,更是一次职业转型的绝佳机遇。凭借扎实的编程基础和逻辑思维能力,程序员在大模型领域拥有众多极具潜力的转行方向。下面,我们将从推荐理由与技能要求两方面,深入探讨这些方向。
2025-06-20 14:43:44
425
原创 一文看懂Embedding模型:从“文字翻译官”到AI的万能钥匙
假设你教一个外星人理解中文,但外星人只懂数字。你要如何将“猫很可爱”翻译成它能理解的形式?答案就是Embedding——它将文字、图片甚至声音转化为数字向量,让机器能“看懂”世界。举个例子:ChatGPT虽然不会中文,但它通过Embedding将你的问题转为向量,再匹配知识库中的向量答案,最后生成回答——整个过程就像一场“数字猜谜游戏”。接下来跟着小编一起了解Embedding向量模型是什么吧~
2025-06-20 14:41:57
806
原创 绝绝子!DeepSeek做AI视频,小白10分钟上手,效果绝了!快来试试,附完整教程!
DeepSeek 真的强,这个春节愣是被 DeepSeek 刷满屏。
2025-06-19 14:38:09
857
原创 一文看懂:AI Agent(智能体)产业链全解(建议收藏)
AI Agent(人工智能代理)可看作具备自主行动能力的智能程序,它能像人类一样感知环境信息、自主规划策略并执行任务。 例如,当你让其预订周末餐厅时,它会先理解你的需求(感知),再拆解为查询评分、查看菜单、确认时间等步骤(规划),最终逐步完成预订(行动)。
2025-06-19 14:25:55
748
原创 Agent爆火原因?一文给你讲清楚我们为什么一定要做Agent智能体?
最近我经常被问到一个问题:为什么一定要做Agent智能体? 或者换句话说,做Agent能够给业务带来什么价值?
2025-06-18 14:34:41
1014
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人