qwen-bg
max-ico04
8K
出去
max-ico02
聊天
max-ico03
禁用
文本嵌入-3-大
Text-embedding-3-large API 提供具有可自定义尺寸的顶级文本嵌入,为复杂应用提供卓越的准确性。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'text-embedding-3-large',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();            
                                
                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="text-embedding-3-large")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()   
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
文本嵌入-3-大

产品详情

✨揭晓 text-embedding-3-largeOpenAI 的突破性嵌入模型

由……推出 OpenAI2024年1月25日text-embedding-3-large 这标志着文本嵌入技术的重大进步。这种新一代模型擅长将复杂的文本数据转换为高效的高维数值表示,这对各种现代机器学习任务至关重要。

基本型号信息:

  • 型号名称: text-embedding-3-large
  • 开发者: OpenAI
  • 发布日期: 2024年1月25日
  • 型号: 文本嵌入

🚀 核心优势和主要特点

text-embedding-3-large 凭借其创新功能脱颖而出,这些功能旨在提供卓越的性能和灵活性:

  • ✓ 顶级性能: 该模型提供了 表现最佳 迄今为止的嵌入式系统展现出比其前身显著的改进,并树立了新的行业标杆。

  • ✓ 灵活的嵌入尺寸: 开发者通过支持从以下维度嵌入数据,获得了前所未有的控制权: 256 至 3072这种灵活性使得性能要求和资源消耗之间能够实现最佳平衡。

  • ✓ 原生支持短链接嵌入: 一项独特的功能,使开发人员能够在不显著损失概念表示的情况下缩短嵌入向量,非常适合优化存储和减少计算开销。

💡 理想的使用场景 text-embedding-3-large

该型号的强大功能使其完美适用于各种高级应用:

  • 高性能搜索: 在庞大的信息库中实现精准、快速的搜索结果。
  • 高级聚类: 便于进行复杂的数据分析和分组,以便更深入地了解复杂的数据集。
  • 强化建议: 强大的推荐引擎,能够提供高度精准且与上下文相关的推荐功能。
  • 稳健的异常检测: 高效识别大型数据流中的异常值和不寻常模式。
  • 详细的多样性测量: 高精度地分析大型文本语料库的广度和多样性。
  • 准确分类: 擅长对复杂的文本数据进行分类,即使在具有挑战性的领域也是如此。
  • 全球多语言支持: 由于增强了对多种语言的支持,它非常​​适合国际化和多语言应用。

⚙️ 技术架构与培训卓越

详细分析:

  • ● 建筑: 建立在尖端技术之上 基于Transformer的架构专为生成具有卓越性能特征的高维嵌入而设计。

  • ● 训练数据: 接受过培训 广泛且高度多样化的数据集经过精心策划,旨在捕捉各种语言细微差别、语义和语境复杂性。

  • ● 数据来源及规模: 该模型的训练包括 数十亿条文本条目确保对人类语言有全面而深刻的理解。

  • ● 多样性与偏见缓解: 我们投入了大量精力来确保训练数据的高度多样性,以便积极地…… 减轻偏见从而增强了模型在不同应用和用户群体中的公平性、稳健性和可靠性。

📈 无与伦比的性能指标

text-embedding-3-large 在关键指标上均表现出显著提升,并达到一流水平:

  • MIRACL评分: 大幅增长 31.4% (由ada-002实现)令人印象深刻 54.9%突出其卓越的检索能力。

  • MTEB 评分: 改进自 61.0% (使用 ada-002)到一个稳健的 64.6%证实了其整体嵌入质量的提升。

  • 准确性: 始终如一地交付成果。 顶级精度 在广泛的多个基准测试中,确保关键任务获得高度可靠的结果。

  • 速度: 针对以下方面进行了优化 更快的处理速度即使使用更大的维度选项,也能保持效率。

  • 鲁棒性: 展品 高性能稳定性 能够应对各种不同的输入类型和复杂的上下文场景,确保可靠运行。

❓ 关于 text-embedding-3-large 的常见问题解答 (FAQ)

问题1: text-embedding-3-large 是什么?它何时发布?

A1: text-embedding-3-large 是 OpenAI 最新、最先进的文本嵌入模型,旨在将文本转换为能够捕捉语义的高维数值向量。它已于 [日期缺失] 正式发布。 2024年1月25日

Q2: 与之前的型号(如ada-002)相比,它的性能提升有多显著?

A2: 它带来了显著的改进,特别是将 MIRACL 得分从 31.4% (ada-002) 提高到 54.9%,将 MTEB 得分从 61.0% (ada-002) 提高到 64.6%。这些指标突显了其卓越的准确性和整体嵌入质量。

Q3: text-embedding-3-large 是否支持自定义嵌入尺寸?

A3: 是的,它具有灵活的嵌入尺寸,允许开发人员从中选择尺寸。 256 至 3072这使得在最佳性能和高效资源利用之间进行微调成为可能。

第四季度: 该模型主要适用于哪些应用场景?

A4: 它非常适合高性能搜索、高级聚类、增强型推荐系统、强大的异常检测、详细的多样性测量和精确的文本分类,尤其适用于需要多语言支持的环境。

Q5: 该模型是否适用于处理多种语言?

A5: 没错。text-embedding-3-large 对多语言的支持有了显著提升,使其成为全球应用和多样化语言数据集的高效解决方案。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用