1.概述

OpenAI 的文本嵌入(Text Embeddings)用于衡量文本字符串之间的相关性。嵌入通常用于以下场景:

  • 搜索(Search):根据查询字符串的相关性对搜索结果进行排序。
  • 聚类(Clustering):将相似的文本字符串分组。
  • 推荐(Recommendations):推荐具有相关文本字符串的项目。
  • 异常检测(Anomaly Detection):识别与其他数据关联较低的异常文本。
  • 多样性测量(Diversity Measurement):分析文本的相似性分布。
  • 分类(Classification):根据最相似的标签对文本字符串进行分类。

模型列表:

  • text-embedding-3-small
  • text-embedding-3-large
  • text-embedding-ada-002

2.请求说明

  • 请求方法: POST
  • 请求地址
  https://gateway.theturbo.ai/v1/embeddings
  

3.请求参数

3.1 Head参数

参数名称 类型 必填 说明 示例值
Content-Type string 设置请求头类型,必须为application/json application/json
Accept string 设置响应类型,建议统一为application/json application/json
Authorization string 身份验证所需的 API_KEY,格式Bearer $YOUR_API_KEY Bearer $YOUR_API_KEY

3.2 Body 参数 (application/json)

参数名称 类型 必填 说明 示例
model string 要使用的模型 ID。详见概述列出的可用版本,如 text-embedding-ada-002 text-embedding-ada-002
input string/array 输入内容。数组维度不得超过2048。输入token数不得超过8192 你好,请给我讲个笑话。
encoding_format string 返回向量的格式。支付floatbase64 float

4.请求示例

5.响应示例

  {
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [
        0.0023064255,
        -0.009327292,
        .... (1536 floats total for ada-002)
        -0.0028842222,
      ],
      "index": 0
    }
  ],
  "model": "text-embedding-ada-002",
  "usage": {
    "prompt_tokens": 8,
    "total_tokens": 8
  }
}