在

出去

聊天

禁用

文本嵌入-ada-002

text-embedding-ada-002 API 提供一致的文本嵌入，价格实惠，是搜索、聚类和推荐应用的理想选择。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'text-embedding-ada-002',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();

                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="text-embedding-ada-002")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()

Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

文本嵌入-ada-002

产品详情

探索 text-embedding-ada-002：OpenAI 的高级文本嵌入模型

模型要点

型号名称： 文本嵌入 ada-002
开发者/创建者： OpenAI
发布日期： 2022年12月
版本： 文本嵌入 ada-002
型号： 文本嵌入

概述：将文本转化为可操作数据

文本嵌入 ada-002 OpenAI 的是其尖端、高效且高度可靠的嵌入模型。其核心功能是将人类语言文本精确转换为数值向量表示，通常称为嵌入。这一能力使其成为各种应用场景中不可或缺的工具。 自然语言处理（NLP）应用使机器能够以前所未有的效率理解、解释和处理人类交流。

显著特征

✨ 高维性： 生成嵌入向量 1536 尺寸确保从文本中获取丰富而详细的语义信息。
🌐 适用范围广： 它的多功能性使其适用于各种 NLP 任务，包括高级搜索功能、智能文本聚类和精确分类系统。
🚀 可扩展性： 针对与企业解决方案的无缝集成进行了优化，能够高效处理大型数据集和高容量请求在不影响性能的前提下。

文本嵌入的多种应用-ada-002

这 文本嵌入 ada-002 模型 为各行各业的众多实际应用提供支持：

🔍 增强搜索： 通过对查询进行深入的语义理解，提高搜索相关性，并对结果进行排名。
📦 智能聚类： 将相似的文本文件或字符串分组在一起，简化数据组织和发现。
💡 个性化推荐： 通过识别相关内容或产品，使推荐引擎更加精准。
🚨 异常检测： 它对安全性和质量控制至关重要，可以识别大型数据集中的异常或离群值条目。
📊 多样性衡量： 分析相似度分布，以确保内容呈现的平衡性和多样性。
🏷️ 准确分类： 根据语义相似性，将文本字符串高精度地分配到预定义的类别中。

亮点：医疗编码效率

这 文本嵌入 ada-002 模型 在以下专业领域展现出卓越的性能： 医疗编码它成功地从一组相似的选项中识别出最相关的代码。 80%的病例与 GPT-4 相比，这是一个显著的改进，GPT-4 在同一任务中达到了 50% 的准确率。

要深入了解此应用以及人工智能在医疗保健领域的其他进展，您可以参考：人工智能在医疗保健领域的应用：生成式人工智能的应用及示例

技术规格

建筑基金会

该模型建立在复杂的 基于Transformer的架构该设计因其在处理序列数据方面卓越的效率而备受赞誉，能够细致地捕捉词语之间的上下文关系，并实现卓越的语义理解。

综合训练数据

文本嵌入 ada-002 接受过相关培训 庞大且多样化的数据集该训练语料库精心收集自广泛的互联网文本，包括学术文章、电子书和各种网页。如此庞大的训练语料库使模型能够有效地泛化到众多领域，并捕捉到细微的语言模式。

知识截止日期

该模型的知识库受到以下因素的限制： 知识截止日期为2021年9月因此，它只能处理和理解截至该特定日期的信息，而不会纳入此期间之后的任何事件或数据。

致力于多元化和消除偏见

OpenAI投入了大量精力，在训练过程中纳入了各种各样的文本来源。 尽量减少潜在偏见尽管采取了这些措施，但由于大规模数据收集的固有特性，某些偏差可能仍然存在。持续评估和定期更新对于解决和减轻任何已发现的偏差至关重要，从而确保负责任的人工智能开发。

性能和基准测试

比较优势

在其发布时， 文本嵌入 ada-002 显著地 表现优于其许多前代产品 以及当代车型，尤其以其令人印象深刻的特点而著称。成本效益和强大的可扩展性。

准确度指标

该模型展示了 强大且稳定的准确性 在关键指标方面：

🌍 MIRACL： 平均得分为 31.4%展示了其在复杂的多语言检索任务中的能力。
🇬🇧 MTEB： 平均得分为 61.0%表明其在各种英语语言任务中表现可靠。

运营效率

⚡ 速度： 该模型经过精心优化，适用于 快速推理因此，对于需要快速数据处理的实时应用和服务而言，这是一个理想的选择。
💪 鲁棒性： 它展现出强大的韧性和稳定性，能够无缝处理 多种多样的输入类型 并保持不同文本格式和语言的性能。

常见问题解答 (FAQ)

Q1: text-embedding-ada-002 的主要功能是什么？

一个： 文本嵌入 ada-002 是 OpenAI 开发的一种模型，旨在将人类文本转换为高维数值表示（嵌入）。这使得机器能够理解和处理文本的语义，从而完成各种自然语言处理任务。

Q2：是什么让 text-embedding-ada-002 适用于企业应用？

A：它的 可扩展性该算法针对处理大型数据集和高容量请求进行了优化，并且广泛适用于众多 NLP 任务，因此非常适合要求苛刻的企业级 AI 解决方案。

Q3：它在医疗编码等专业任务中的表现如何？

答：在医疗编码中， 文本嵌入 ada-002 在识别相关代码方面，成功率达到了 80%，显著优于 GPT-4 在同一任务上的 50% 准确率。

Q4：该模型的知识截止要求是什么？

答：该模型的信息更新至…… 知识截止日期为2021年9月它不包括此特定日期之后发生的信息或事件。

Q5：其关键绩效指标是什么？

一个： 文本嵌入 ada-002 在 MIRACL（平均 31.4%）多语言任务基准测试和 MTEB（平均 61.0%）英语语言任务基准测试中表现出色，同时在成本效益、速度和鲁棒性方面也表现优异。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

一个 API
300多个人工智能模型

节省20%的费用