自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 旅游攻略?快拉倒吧!Dify给安排的明明白白的!

让它“劈个叉”,同时拉两条线出去,一条给 `Tavily Search`,另一条给我们之前做好的。于是我想,能不能让AI来帮我搞定这个事情,因为当我面临选择的时候我很难做出抉择,因为2个选项看着都差不多,所以我开始寄希望于外部力量了。:你跟它说"下周去成都玩五天",它灵机一动,立马就抓住俩关键词:`成都` 和 `5天`,精准打击。:一边搜产品信息,一边扒用户评论,再看看新闻,几条线一起跑,最后“啪”地给你一份报告。最后,把这个 `LLM` 节点的输出,连到 `直接回复` 节点,齐活儿!

2025-08-15 16:09:28 211 1

原创 让 Dify AI 当你的邮件小助理,一键群发不是梦

别担心,不是让你交出密码,而是去你的163邮箱后台(其他邮箱也类似)开启一个叫 SMTP 的服务,领一个“授权码”。我跟你说,我之前就是这么个苦哈哈的状态,直到我发现了新大陆--Dify群发邮件。思路很简单:我跟 Dify 说,“喏,这是邮件内容,这是收件人列表”。Dify 的好玩之处就在于此,它能把你的各种奇思妙想变成现实。你看,就这么几下,一个烦人的手动活儿就变成全自动的了。点击执行,然后去你的邮箱看看,是不是很快就收到了 AI 助理发来的“正式”邮件?好了,准备工作就绪,开始搭我们的自动化流水线!

2025-08-14 15:13:42 360 1

原创 Dify实战:让你的AI化身美食家,成为最懂你的本地美食向导

继上次我们打造了“脑筋急转弯大王”和“天气预报员”之后,我们已经学会使用Dify的两大核心技能:强大的知识库和连接现实世界的API。今天,我们通过 参数提取 -> 工具调用 -> LLM总结 这个黄金公式,又一次创造了一个强大又实用的AI应用。2. 全网搜索 (Tavily):拿着这两个关键词,去互联网上搜索近30天的信息(当然可以根据自己的需求设置这个时间)。老规矩,准备好咱的Dify环境和必要的插件:OpenAI-API-compatible 和 Tavily。在Tavily节点后,就是LLM的节点。

2025-08-12 18:40:59 763 1

原创 Dify实战:打造你的专属天气预报员

高德的API服务商就是这个信息的提供者,我们通过Dify调用它的API,就像是把一个“查询天气”的功能,添加到了我们的AI应用中。API返回给我们的,通常是一串机器才看得懂的JSON数据,像这样:`{"temp": "28", "condition": "多云", "wind": "3级"}`。继上一篇我们用Dify打造了“脑筋急转弯大王”,让AI拥有了强大的“内置知识库”以及强大的联网工具。赶紧动手试试,接入更多有趣的API,创造出属于你自己的、独一无二的AI应用吧!我们用一个更精准的工具:参数提取器。

2025-08-08 14:28:56 666

原创 Dify:我的AI玩具箱!零代码拼出AI版‘脑筋急转弯’

我安排的分拣员是`gemini-2.5-flash-lite`,一位又快又聪明的员工(除了最后总结回答的情况,我都用的他,能者多劳嘛,哈哈哈哈哈)。无论是文档、网页,还是飞书/Notion里的数据,都可以成为AI的“外挂大脑”,让它上知天文,下知你的“小秘密”。我就跳过注册账户这一步啦,但请一定要记住自己的账号密码,这是个大坑(当时随便写了个邮箱,然后就被我遗忘在风中了)。然后我们稍等片刻,就可以在控制台中看到Dify的名字了,点击进入,开始今天的Dify之旅。工欲善其事,必先利其器。

2025-08-06 14:39:07 738 1

原创 vLLM 实战——推理革命

而PagedAttention采用了类似操作系统虚拟内存的思想,将显存划分成一个个固定大小的页面(pages),按需分配和回收,只在需要的时候申请空间,大大提高了内存利用率。传统的大模型推理服务就像是高档餐厅中的服务员,一次只会服务一桌客人,要等这一桌客人用餐完,才会去服务下一桌,这样就会导致效率十分低下。但模型训完了,然后呢?这里选择一卡就好,因为我准备运行的是一个1.5B的小模型(也就是之前训练出来的那个,感兴趣的可以看看之前的训练篇章)。没被我绕晕,是我带出来的模型没错了,速度也是快得可怕。

2025-08-04 14:36:35 639

原创 LLaMA-Factory LoRA微调 Qwen2.5-1.5B Instruct版本

本文介绍了LoRA 微调方法,相比全参数微调具有高性价比优势。

2025-07-29 13:37:04 659

原创 LLaMA-Factory 全参微调 Qwen2.5-1.5B Instruct版本

本文介绍了使用LLaMA-Factory对Qwen2.5-1.5B Instruct版本进行全参微调的过程。

2025-07-25 13:33:48 702

原创 LLaMA-Factory 全参微调 Qwen2.5-1.5B

本文记录了使用 LLaMA-Factory 对 Qwen2.5-1.5B 模型进行全参微调的完整过程,希望对大家有所帮助。

2025-07-24 15:07:46 482

原创 Dify:低代码 AI 应用开发平台

Dify 是一款开源的低代码 AI 应用开发平台,它将 LLM(大型语言模型)的概念转化为易于使用的可视化工作流。通过 Dify,您可以快速构建智能对话机器人、AI 助手、工作流自动化应用等各种 AI 驱动的应用程序。

2025-07-14 14:01:47 1129

原创 vLLM:高速推理引擎

vLLM 高速推理引擎,提供一站式的大语言模型(LLM)部署与管理服务

2025-07-10 15:14:05 888

原创 LlamaFactory 保姆级教程:手把手教你训练专属AI大模型

LLaMA Factory:高效 LLM 微调平台

2025-07-10 14:55:18 346

原创 算力革命 | 4090显卡集群开放租赁,以专业级性能重构AI研发边界

当深度学习模型参数量级突破千亿门槛,当AIGC内容生成需求呈指数级爆发,算力资源已成为制约创新的隐形天花板。高校实验室因预算捉襟见肘而被迫降低batch size,创业团队因显卡采购周期延误关键产品迭代,科研人员不得不在模型精度与训练时长间反复妥协——此刻,NVIDIA RTX 4090专业级算力集群的弹性租赁方案,正以颠覆性成本重构AI研发范式。月租战略卡位:¥97XX/台起锁定30天使用权,日均成本下探至传统云服务1/3,适合长期迭代的CV/NLP项目。【核心价值:三轴驱动的算力自由】

2025-05-15 14:08:29 450 1

原创 【零门槛实测】5分钟微调DeepSeek-7B

5分钟微调DeepSeek-7B,让AI模型微调像搭积木一样简单

2025-03-27 18:30:16 1784

原创 手把手教你如何全参微调QWEN2.5

本次实战采用QWEN2.5的0.5b的小体量模型在弱智吧数据集上进行微调。通过本次实战,希望大家能够掌握以下技能:1,如何快速获取廉价算力2,如何在QWEN模型上进行全参微调。

2024-12-24 11:31:21 2174 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除