1.概述

Stability.ai 是一家专注于开发人工智能模型的公司,该公司的代表性模型是 Stable Diffusion,它是一个基于深度学习的图像生成模型,因其能够从文本描述生成高质量图像而广受关注。

说明:

1.该系列模型对中文支持不太友好,使用自然语言描述时尽量使用英文

模型列表:

  • sd-ultra
  • sd3-large
  • sd3.5-large
  • sd3-large-turbo
  • sd3.5-large-turbo
  • sd3-medium
  • sd3.5-medium
  • sd-core

2.请求说明

  • 请求方法: POST
  • 请求地址
  https://gateway.theturbo.ai/v1/images/generations
  

3.请求参数

3.1 Head参数

参数名称 类型 必填 说明 示例值
Content-Type string 设置请求头类型,必须为multipart/form-data multipart/form-data; boundary=------------------------y0QNRDhXQUE3yHQi7DEbLz
Accept string 设置响应类型,必须为 image/* image/*
Authorization string 身份验证所需的 API_KEY,格式Bearer $YOUR_API_KEY Bearer $YOUR_API_KEY

3.2 Body 参数 (multipart/form-data)

参数名称 类型 必填 说明 示例(默认值)
model string 要使用的模型 ID。详见概述列出的可用版本,如 sd3-large sd3-large
prompt string 一段描述所需图像的文字。描述最大长度为 10000 字符。 A cute baby sea otter
mode string 控制是 text-to-image 还是 image-to-image,这会影响所需的参数:text-to-image 仅需要 prompt 参数,image-to-image 需要 promptimagestrength 参数。sd-core 不支持 image-to-image text-to-image
image string(binary) 用于作为生成起始点的图像,只用于 image-to-image 。支持的格式:jpeg png webp;支持的尺寸:每一边必须至少为 64 像素。
strength number[0,1] 有时被称为去噪(denoising),此参数控制原图像参数对生成图像的影响程度。值为 0 时,生成的图像与输入图像完全相同;值为 1 时,生成的图像就像没有传入任何图像一样。 0.9
negative_prompt string 不希望在输出图像中看到的内容的关键词。sd3-large-turbo 不支持这个参数。 a cat
seed number[0,4294967294] 一个用于引导生成“随机性”的特定值。(如果省略此参数或传递 0,将使用随机种子) 0
aspect_ratio string 控制生成图像的纵横比。支持 16:9 1:1 21:9 2:3 3:2 4:5 5:4 9:16 9:21 1:1
output_format string jpeg or png png
style_preset string 引导图像模型朝向特定的风格。支持3d-model analog-film anime cinematic comic-book digital-art enhance fantasy-art isometric line-art low-poly modeling-compound neon-punk origami photographic pixel-art tile-texture。只有sd-core支持这个参数。 -

4.请求示例

text-to-image

  curl https://gateway.theturbo.ai/v1/images/generations \
	-H "Accept: image/*" \
	-H "Authorization: Bearer $YOUR_API_KEY" \
	-F model="sd3-large" \
	-F prompt="A cute baby sea otter wearing a beret"
  

image-to-image

  curl https://gateway.theturbo.ai/v1/images/generations \
	-H "Accept: image/*" \
	-H "Authorization: Bearer $YOUR_API_KEY" \
	-F model="sd3-large" \
	-F prompt="A cute baby sea otter wearing a beret" \
	-F mode="image-to-image" \
	-F image="@input.png" \
	-F strength=0.9 \
  

5.响应示例

  HTTP/1.1 200 OK
Content-Type: image/png

图片二进制文件