1.概述

Stability.ai 是一家专注于开发人工智能模型的公司,该公司的代表性模型是 Stable Diffusion,它是一个基于深度学习的图像生成模型,因其能够从文本描述生成高质量图像而广受关注。

说明:

1.该系列模型对中文支持不太友好,使用自然语言描述时尽量使用英文

模型列表:

利用预测和生成式 AI 将图像分辨率提升 4 倍。该服务轻量且快速(处理时间约 1 秒),非常适合提升压缩图像的质量,适用于社交媒体发布及其他应用场景。

可以将分辨率在 64x64 到 1 兆像素之间的图像放大至 4K 分辨率。更一般地说,它可以将图像放大约 20-40 倍,同时保留所有细节。该方法尽量减少对图像的改动,不适用于对图像进行重新构想。

通过使用图像掩码移除不需要的对象,例如人像中的瑕疵或桌面上的物品。

智能地修改图像,根据mask图像的内容填充或替换指定区域的新内容。

通过在图像任意方向上插入额外内容来填充空间。与其他自动或手动扩展图像内容的方法相比,该服务应尽量减少伪影和原始图像被编辑的痕迹。

该服务是一种特定版本的修复技术,无需使用mask。相反,用户可以通过search_prompt 使用简单的语言描述要替换的对象。服务会自动分割该对象,并将其替换为提示中请求的内容。

该服务允许通过提示更改图像中特定对象的颜色。该服务是一种无需掩码的特定修复技术版本。该服务会自动分割对象,并根据提示中请求的颜色对其重新着色。

该服务能够准确地从图像中分割前景并去除背景。

该服务为需要头脑风暴和频繁迭代的设计项目提供了理想的解决方案。它将粗略的手绘草图升级为精细的输出,并提供精确的控制。对于非草图图像,它通过利用图像中的轮廓线和边缘,允许对最终外观进行详细的调整。

该服务在生成图像方面表现出色,通过保持输入图像的结构,使其在高级内容创作场景中尤为有价值,例如重新创建场景或从模型渲染角色。

该服务从输入图像(控制图像)中提取风格元素,并利用这些元素指导基于提示创建输出图像。结果是生成一张与控制图像风格相同的新图像。

2.请求说明

  • 请求方法: POST
  • 请求地址
  https://gateway.theturbo.ai/v1/images/edits
  

3.请求参数

3.1 Head参数

参数名称 类型 必填 说明 示例值
Content-Type string 设置请求头类型,必须为multipart/form-data multipart/form-data; boundary=------------------------y0QNRDhXQUE3yHQi7DEbLz
Accept string 设置响应类型,必须为 image/* image/*
Authorization string 身份验证所需的 API_KEY,格式Bearer $YOUR_API_KEY Bearer $YOUR_API_KEY

3.2 Body 参数 (multipart/form-data)

参数名称 类型 必填 说明 示例值(默认值)
model string 要使用的模型 ID。详见概述列出的可用版本,如 sd-upscale-fast sd-upscale-fast
image string(binary) 用于作为生成起始点的图像。 -

说明:

1.其它必填或可选参数请参照概述中的官方文档地址。

4.请求示例

  curl https://gateway.theturbo.ai/v1/images/generations \
	-H "Accept: image/*" \
	-H "Authorization: Bearer $YOUR_API_KEY" \
	-F model="sd-upscale-fast" \
	-F image="@input.png" \
	-F ... 其它参数
  

5.响应示例

  HTTP/1.1 200 OK
Content-Type: image/png

图片二进制文件