在

出去

聊天

禁用

文本嵌入-3-大

Text-embedding-3-large API 提供具有可自定义尺寸的顶级文本嵌入，为复杂应用提供卓越的准确性。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'text-embedding-3-large',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();

                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="text-embedding-3-large")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()

Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

文本嵌入-3-大

产品详情

✨揭晓 text-embedding-3-largeOpenAI 的突破性嵌入模型

由……推出 OpenAI 在 2024年1月25日， text-embedding-3-large 这标志着文本嵌入技术的重大进步。这种新一代模型擅长将复杂的文本数据转换为高效的高维数值表示，这对各种现代机器学习任务至关重要。

基本型号信息：

► 型号名称： text-embedding-3-large
► 开发者： OpenAI
► 发布日期： 2024年1月25日
► 型号： 文本嵌入

🚀 核心优势和主要特点

text-embedding-3-large 凭借其创新功能脱颖而出，这些功能旨在提供卓越的性能和灵活性：

✓ 顶级性能： 该模型提供了 表现最佳 迄今为止的嵌入式系统展现出比其前身显著的改进，并树立了新的行业标杆。
✓ 灵活的嵌入尺寸： 开发者通过支持从以下维度嵌入数据，获得了前所未有的控制权： 256 至 3072这种灵活性使得性能要求和资源消耗之间能够实现最佳平衡。
✓ 原生支持短链接嵌入： 一项独特的功能，使开发人员能够在不显著损失概念表示的情况下缩短嵌入向量，非常适合优化存储和减少计算开销。

💡 理想的使用场景 text-embedding-3-large

该型号的强大功能使其完美适用于各种高级应用：

▷ 高性能搜索： 在庞大的信息库中实现精准、快速的搜索结果。
▷ 高级聚类： 便于进行复杂的数据分析和分组，以便更深入地了解复杂的数据集。
▷ 强化建议： 强大的推荐引擎，能够提供高度精准且与上下文相关的推荐功能。
▷ 稳健的异常检测： 高效识别大型数据流中的异常值和不寻常模式。
▷ 详细的多样性测量： 高精度地分析大型文本语料库的广度和多样性。
▷ 准确分类： 擅长对复杂的文本数据进行分类，即使在具有挑战性的领域也是如此。
▷ 全球多语言支持： 由于增强了对多种语言的支持，它非常适合国际化和多语言应用。

⚙️ 技术架构与培训卓越

详细分析：

● 建筑： 建立在尖端技术之上 基于Transformer的架构专为生成具有卓越性能特征的高维嵌入而设计。
● 训练数据： 接受过培训 广泛且高度多样化的数据集经过精心策划，旨在捕捉各种语言细微差别、语义和语境复杂性。
● 数据来源及规模： 该模型的训练包括 数十亿条文本条目确保对人类语言有全面而深刻的理解。
● 多样性与偏见缓解： 我们投入了大量精力来确保训练数据的高度多样性，以便积极地…… 减轻偏见从而增强了模型在不同应用和用户群体中的公平性、稳健性和可靠性。

📈 无与伦比的性能指标

text-embedding-3-large 在关键指标上均表现出显著提升，并达到一流水平：

⚡ MIRACL评分： 大幅增长 31.4% （由ada-002实现）令人印象深刻 54.9%突出其卓越的检索能力。
⚡ MTEB 评分： 改进自 61.0% （使用 ada-002）到一个稳健的 64.6%证实了其整体嵌入质量的提升。
⚡ 准确性： 始终如一地交付成果。 顶级精准度 在广泛的多个基准测试中，确保关键任务获得高度可靠的结果。
⚡ 速度： 针对以下方面进行了优化 更快的处理速度即使使用更大的维度选项，也能保持效率。
⚡ 鲁棒性： 展品 高性能稳定性 能够应对各种不同的输入类型和复杂的上下文场景，确保可靠运行。

❓ 关于 text-embedding-3-large 的常见问题解答 (FAQ)

问题1：什么是 text-embedding-3-large？它何时发布？

A1： text-embedding-3-large 是 OpenAI 最新、最先进的文本嵌入模型，旨在将文本转换为能够捕捉语义的高维数值向量。它已于 [日期缺失] 正式发布。 2024年1月25日。

Q2：与之前的型号（如ada-002）相比，它的性能提升有多显著？

A2： 它带来了显著的改进，特别是将 MIRACL 得分从 31.4% (ada-002) 提高到 54.9%，将 MTEB 得分从 61.0% (ada-002) 提高到 64.6%。这些指标突显了其卓越的准确性和整体嵌入质量。

Q3： text-embedding-3-large 是否支持自定义嵌入尺寸？

A3： 是的，它具有灵活的嵌入尺寸，允许开发人员从中选择尺寸。 256 至 3072这使得在最佳性能和高效资源利用之间进行微调成为可能。

第四季度：该模型主要适用于哪些应用场景？

A4： 它非常适合高性能搜索、高级聚类、增强型推荐系统、强大的异常检测、详细的多样性测量和精确的文本分类，尤其适用于需要多语言支持的环境。

Q5：该模型是否适用于处理多种语言？

A5： 没错。text-embedding-3-large 对多语言的支持有了显著提升，使其成为全球应用和多样化语言数据集的高效解决方案。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

一个 API
300多个人工智能模型

节省20%的费用