一、案例介绍
本案例介绍了如何使用阿里云百炼模型实现文本生成图像。具体步骤包括:
- 如何使用业务空间
- 申请和创建API Key
- 文本生成图像的具体实现
二、新增业务空间
2.1 选择要授权的子业务空间
访问业务空间管理页面,找到需要授权的子业务空间后,单击其右侧的模型权限流控设置。
2.2 为子业务空间授权
-
找到目标模型,然后单击其右侧的编辑。
-
开启相应权限,然后单击保存。若该业务空间先前已授权过,无需重复授权。
对于不支持训练/部署的模型,开启按钮不可见。查看支持训练的完整模型列表。查看支持部署的完整模型列表
三、创建API Key
3.1 获取API Key
-
前往我的API-KEY页面,单击创建我的API-KEY
-
在已创建的API Key操作列,单击查看,获取API KEY。
四、文本生成图像
4.1 模型概览
通义万象文生图模型支持通过一句话生成图像,文生图V2版模型提升了语义理解能力,通过预置智能改写功能帮助您快速上手图像创作。
- 文生图2.1系列模型:wanx2.1-t2i-turbo、wanx2.1-t2i-plus。
- 文生图2.0系列模型:wanx2.0-t2i-turbo。
3.2 文生图模型介绍
通义万相-文生图V2系列模型具体介绍
模型建议:推荐优先选择文生图V2版模型。
- 若需要高质量图像,选择文生图2.1(
wanx2.1-t2i-turbo
或wanx2.1-t2i-plus
),其中wanx2.1-t2i-turbo
更具性价比。 - 若考虑成本,可选择文生图2.0(
wanx2.0-t2i-turbo
)。
3.3 安装DashScope
- 安装DashScope
pip install dashscope
- DashScope实现图像生成
from http import HTTPStatus
from urllib.parse import urlparse, unquote
from pathlib import PurePosixPath
import requests
from dashscope import ImageSynthesis
import os
prompt = "一间有着精致窗户的花店,漂亮的木质门,摆放着花朵"
os.environ["DASHSCOPE_API_KEY"] = "sk-ec2f397674b7409caf29f84b5b3e2a94"
print('----sync call, please wait a moment----')
rsp = ImageSynthesis.call(api_key=os.getenv("DASHSCOPE_API_KEY"),
model="wanx2.1-t2i-turbo",
prompt=prompt,
n=1,
size='1024*1024')
print('response: %s' % rsp)
if rsp.status_code == HTTPStatus.OK:
# 在当前目录下保存图片
for result in rsp.output.results:
file_name = PurePosixPath(unquote(urlparse(result.url).path)).parts[-1]
with open('result.png', 'wb+') as f:
f.write(requests.get(result.url).content)
else:
print('sync_call Failed, status_code: %s, code: %s, message: %s' %
(rsp.status_code, rsp.code, rsp.message))
- 运行结果