qwen-bg
max-ico04
8K
出去
max-ico02
聊天
max-ico03
禁用
文本嵌入-3-小
text-embedding-3-small API 增强了文本表示,与它的前身 text-embedding-ada-002 相比,提供了更高的准确性和成本效益。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'text-embedding-3-large',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();            
                                
                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="text-embedding-3-large")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()   
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
qwenmax-bg
图片
文本嵌入-3-小

产品详情

介绍 text-embedding-3-smallOpenAI在文本嵌入方面的最新创新

发布者 OpenAI 2024年1月25日 text-embedding-3-small 是一款尖端的文本嵌入模型,旨在提供卓越的性能和效率。该模型标志着一项重大进步,旨在将各种文本输入转换为紧凑的数值表示(嵌入),这些表示在各种机器学习应用中都非常有效。它是 的强大继任者。 文本嵌入 ada-002全面提升各项功能。

🌟 主要特点和优势

  • 性能提升: 在多语言检索(MIRACL)和英语特定任务(MTEB)方面取得了显著的改进,使其更加稳健和准确。
  • 💰 成本效益: 体验实质性的 成本降低5倍 与前代产品相比, 文本嵌入 ada-002为开发商和企业节省大量成本。
  • 📏 尺寸小巧: 嵌入尺寸为 512 尺寸该型号非常适合内存和存储受限的环境,可在不影响质量的前提下确保高效运行。

🚀 用途广泛

text-embedding-3-small 该模型专为各种应用而设计,可实现智能文本分析和集成:

  • 智能搜索: 通过基于语义相关性对搜索结果进行精确排序,提升搜索算法的性能。
  • 文本聚类: 将相似的文本文件或字符串分组,以便进行高级数据分析和组织。
  • 推荐系统: 通过基于文本相似度推荐相关商品,为复杂的推荐引擎提供支持。
  • 异常检测: 以更高的精度识别大型数据集中的异常模式或离群值。
  • 多样性衡量: 分析文本数据的广度和多样性,以获得更深入的见解。
  • 内容分类: 通过将文本字符串与其语义最相似的标签关联起来,对文本字符串进行分类。

🌐 广泛的语言支持

专为全球受众设计, text-embedding-3-small 提供强大的支持 多语言显著提高了其在各种语言数据集和国际应用中的可访问性和实用性。

⚙️ 技术规格

  • 建筑学: 该模型利用了最先进的 基于Transformer的架构经过精心优化,兼顾计算效率和高性能嵌入生成。
  • 训练数据: 接受过培训 广泛而多样的文本资料集确保其能够捕捉广泛的语言模式和语义细微差别。这种全面的训练最大限度地减少了偏差,并确保其在不同人群和使用场景下都能表现出色。
  • 数据来源和规模: 涵盖数百万份文本文件,使该模型能够深刻理解语言的复杂性和语境。

📊 性能基准

text-embedding-3-small 该模型在嵌入式性能方面树立了新标准:

  • 与以往相比有了显著改进 文本嵌入 ada-002
    • MIRACL评分: 从 31.4% 增加到 44.0% (显著提升 12.6%)。
    • MTEB 评分: 从 61.0% 提高到 62.3%
  • 🎯 更高的准确率: 在多语言和英语专用基准测试中均表现出卓越的准确性,提供更精确、更可靠的嵌入。
  • 速度提升: 与之前的型号相比,运行效率更高,从而降低了延迟和计算资源需求。
  • 🛡️ 鲁棒性: 能够有效处理各种输入类型,确保在各种应用和数据复杂性下都能提供一致可靠的性能。

常见问题解答 (FAQ)

Q1: 什么是 text-embedding-3-small?

A1:这是 OpenAI 于 2024 年 1 月 25 日发布的最新文本嵌入模型,旨在将文本转换为高效的数值表示(嵌入),用于机器学习任务,与之前的模型相比,性能和成本效益均有所提高。

Q2:它与 text-embedding-ada-002 相比如何?

A2: text-embedding-3-small 性能显著提升(例如,MIRACL 和 MTEB 得分更高),且成本效益是现有产品的 5 倍。 文本嵌入 ada-002同时保持紧凑的嵌入尺寸。

Q3:该模型的主要应用场景是什么?

A3:它非常适合各种应用,包括智能搜索、文本聚类、推荐系统、异常检测、多样性测量以及跨多种语言的文本分类。

Q4:text-embedding-3-small 是否适用于多语言应用?

A4:是的,它拥有广泛的多语言支持,并在多语言检索基准测试(MIRACL)中表现出显著的性能提升,使其非常适合各种语言数据集。

Q5:text-embedding-3-small 的嵌入维度是多少?

A5:该模型生成的嵌入具有紧凑的尺寸。 512 尺寸这使得它在内存和存储受限的环境中非常高效。

API 操练场(Playground)

集成前,请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。
免费试用
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用