【人工智能】使用 Dify 搭建 AI 图片生成应用

随着图像生成技术的兴起,涌现了许多优秀的图像生成产品,比如 Dall-eFluxStable Diffusion 等。

本文将使用图像生成模型,指导你 使用 Dify 快速开发一个 AI 图片生成应用

本实验中你将掌握的知识点

  • 使用 Dify 构建 Agent 的方法
  • Agent 的基本概念
  • 提示词工程的基础知识
  • 工具的使用
  • 大模型的幻觉的概念

1.获取和填入 Stablility API 密钥

点击这里 即可跳转至 Stability 的 API 密钥管理页。如果你尚未注册,会被要求先注册再进入管理页。

进入管理页后,点击复制密钥即可。

接下来,你需要通过以下步骤把密钥填入 Dify工具Stability 中:

  • 登录 Dify
  • 进入工具
  • 选择 Stability
  • 点击授权
  • 填入密钥并保存

2.配置模型供应商

为了优化交互,我们需要 LLM 来将用户的指令具体化,也就是让 LLM 来撰写生成图片的 提示词(Prompt)。接下来,我们按照如下的步骤在 Dify 配置模型供应商。

Free 版本的 Dify 提供了免费 200 条 OpenAI 的消息额度。

如果消息额度不够用,你可以参考下图步骤,自定义其它模型供应商:

  • 点击 右上角头像设置模型供应商

如果尚未找到合适的模型供应商,groq 平台提供了 Llama 等 LLM 的免费调用额度。

  • 登录 groq API 管理页
  • 点击 Create API Key,设置一个想要的名称并且复制 API Key。

回到 Dify模型供应商,选择 groqcloud,点击 设置

粘贴 API Key 并保存。

3.构建 Agent

回到 Dify工作室,选择 创建空白应用

在本实验中,我们只需要了解 Agent 的基础用法即可。

❓ 什么是 Agent
Agent 是一种模拟人类行为和能力的 AI 系统,它通过自然语言处理与环境交互,能够理解输入信息并生成相应的输出。Agent 还具有 “感知” 能力,可以处理和分析各种形式的数据。此外,Agent 能够调用和使用各种外部工具和 API 来完成任务,扩展其功能范围。这种设计使 Agent 能够更灵活地应对复杂情况,在一定程度上模拟人类的思考和行为模式。因此,很多人都会将 Agent 称为 “智能体”。

选择 Agent,填写名称即可。

接下来你会进入到如下图的 Agent 编排界面

我们选择 LLM,本篇教程中我们使用 groq 提供的 Llama-3.1-70B 为例:

工具 中添加 AI 绘图工具 Stability:

3.1 撰写提示词

提示词(Prompt)是 Agent 的灵魂,直接影响到输出的效果。通常来说越具体的提示词输出的效果越好,但是过冗长的提示词也会导致一些负面效果。

调整提示词的工程,我们称之为 提示词工程(Prompt Engineering)。

在本次实验中,你不必担心没有掌握提示词工程,我们会在后面循序渐进地学习它。

让我们从最简单的提示词开始:

根据用户的提示,使用工具 stability_text2image 绘画指定内容

用户每次输入命令的时候,Agent 都会知晓这样的系统级的指令,从而了解要执行用户绘画的任务的时候需要调用一个叫 stability 的工具。

例如:画一个女孩,手中拿着一本打开的书

3.2 不想撰写提示词?当然可以!

点击提示词的右上角 生成

指令 中输入你的需求,点击 生成,右侧生成的提示词中会出现由 AI 生成的提示词。

不过,为了养成对提示词良好的理解,我们在初期最好不要依赖这一项功能。

4.发布

点击右上角的 发布 按钮,发布后选择 运行 就可以获得一个在线运行的 Agent 的网页。

复制这个网页的 URL,可以分享给其他好友使用。

5.思考

5.1 如何指定生成图片的画风?

我们可以在用户输入的命令中加上画风的指令,例如:二次元风格,画一个女孩,手中拿着一本打开的书

但是如果我们希望风格默认都是二次元风格呢,那么我们加在系统提示词里就行了,因为我们之前了解到系统提示词是每次执行用户命令都会知晓的,优先级更高。

根据用户的提示,使用工具 stability_text2image 绘画指定内容,画面是二次元风格

5.2 如何拒绝部分用户的某些请求?

在许多业务场景中,我们需要避免输出一些不合理的内容,但是 LLM 很多时候比较 “傻”,用户下指令时会照做不误,即使输出的内容是错的,这种模型为了努力回答用户而编造虚假内容的现象称为 模型幻觉(Hallucinations),那么我们需要让模型必要的时候拒绝用户的请求。

此外,用户也可能提一些和业务无关的内容,我们也需要让 Agent 这个时候拒绝请求。

我们可以使用 markdown 格式给不同的提示词进行划分,将上述教 Agent 拒绝不合理内容的提示词写到 “约束” 标题下。当然,这样的格式仅仅是为了规范化,你可以有自己的格式。

## 任务
根据用户的提示,使用工具 stability_text2image 绘画指定内容,画面是二次元风格。

## 约束
如果用户在请求和绘画无关的内容,回复:“对不起,我不明白你在说什么”

例如,我们尝试提问:今晚吃什么

在一些更正式的业务场景中,我们可以调用敏感词库来拒绝用户的请求。

添加功能内容审查 中添加关键词 “晚饭”,当用户输入关键词时,则 Agent 应用输出 “对不起,我不明白你在说什么”。

🚀 参考:https://docs.dify.ai/zh-hans/workshop/basic/build-ai-image-generation-app

<think>好的,用户想了解如何在Dify平台上创建文本生成应用。首先,我需要回忆一下Dify平台的相关信息,特别是用户提供的引用内容。引用[1]提到在Dify应用创建页面上有直观的界面,支持创建各种AI应用,包括文本生成。引用[2]详细说明了文本生成助手可以用于编写故事、分类、翻译等任务,并且工作流适合内容生成等场景。 用户的需求很明确,需要一步步的教程。我应该从注册和登录开始,然后进入创建应用的步骤。需要强调选择正确的应用类型,即文本生成。接下来,配置部分可能包括选择模型、设置提示词和参数调整。这里可能需要详细说明提示词工程的重要性,比如如何编写有效的提示词来生成优质文本。 然后,测试和迭代也是关键步骤,用户可能需要知道如何通过测试来优化应用。最后,部署和集成部分应该包括发布应用和API的使用,方便用户将应用集成到自己的系统中。同时,要提醒用户参考官方文档获取最新信息,并利用Dify提供的丰富模型和可视化编排工具来提升效果。 需要确保回答结构清晰,分步骤说明,并且每个步骤都包含具体的操作指导。同时,根据用户提供的引用内容,适当引用参考资料,比如在提到模型选择时引用[^2]。还要注意使用正确的中文表达,避免技术术语过于复杂,让新手也能理解。最后,生成相关问题,帮助用户深入探索,比如优化方法和模型选择等。</think>以下是在 Dify 平台创建文本生成应用程序的详细步骤指南: ### 一、准备阶段 1. **注册/登录账户** 访问[Dify官网](https://dify.ai)并完成注册,已有账户直接登录进入控制台[^1]。 2. **创建工作区** 在控制台点击「新建工作区」,根据业务场景命名(例如"内容创作助手")。 ### 二、创建应用 1. **选择应用类型** 在「创建应用」界面选择「文本生成」类型,系统会提供预置模板(如故事生成、新闻稿撰写)。 2. **基础配置** - **命名与描述**:输入应用名称(如"智能文案生成器"),添加功能描述 - **模型选择**:从支持的模型列表中选择适合的LLM(如GPT-4、Claude-2) $$ \text{模型性能公式}:Q = \alpha \cdot \text{Accuracy} + \beta \cdot \text{Speed} $$ ### 三、核心配置 1. **提示词工程** 在「提示词编排」界面: - 定义系统角色:`你是一位专业文案编辑,擅长生成吸引眼球的营销文案` - 设置输入变量:通过`{{ }}`定义占位符(如`{{产品名称}}`、`{{目标人群}}`) - 示例: ```python "为{{产品名称}}撰写3条面向{{目标人群}}的广告语,要求:" "1. 包含核心卖点{{卖点}} 2. 不超过20字" ``` 2. **参数调优** 在「高级设置」中调整: - Temperature:0.7(创造性) - Max tokens:500 - 重复惩罚:1.2 ### 四、测试与迭代 1. **即时调试** 使用右侧预览窗口输入测试用例: ``` 产品名称:智能手表 目标人群:运动爱好者 卖点:心率监测、GPS定位 ``` 2. **版本管理** 通过「版本历史」保存不同配置,对比生成效果: | 版本 | Temperature | 输出质量 | |------|-------------|----------| | v1.0 | 0.5 | 严谨但缺乏创意 | | v1.1 | 0.7 | 平衡度最佳 | ### 五、部署与集成 1. **发布渠道** - Web端:生成专属访问链接 - API接入:获取API端点及密钥 ```bash curl -X POST "https://api.dify.ai/v1/your-app-id" \ -H "Authorization: Bearer YOUR_API_KEY" \ -d '{"parameters": {...}}' ``` 2. **监控分析** 在「数据分析」面板查看: - 调用次数统计 - 平均响应时间 - 用户反馈评分 ### 六、最佳实践 1. **多场景适配** 通过分支逻辑处理不同需求: ```mermaid graph TD A[用户输入] --> B{是否指定风格?} B -->|是| C[调用创意模式] B -->|否| D[使用标准模式] ``` 2. **安全机制** - 内容过滤器设置 - 敏感词屏蔽列表 - 输出长度限制
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据与AI实验室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值