



const { OpenAI } = require('openai');
const main = async () => {
const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });
const text = 'Your text string goes here';
const response = await api.embeddings.create({
input: text,
model: 'text-embedding-3-large',
});
const embedding = response.data[0].embedding;
console.log(embedding);
};
main();
import json
from openai import OpenAI
def main():
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
text = "Your text string goes here"
response = client.embeddings.create(input=text, model="text-embedding-3-large")
embedding = response.data[0].embedding
print(json.dumps(embedding, indent=2))
main()
- API 操练场(Playground)

在集成之前,请在沙箱环境中测试所有 API 模型。
我们提供 300 多种模型供您集成到您的应用程序中。


产品详情
✨揭晓 text-embedding-3-largeOpenAI 的突破性嵌入模型
由……推出 OpenAI 在 2024年1月25日, text-embedding-3-large 这标志着文本嵌入技术的重大进步。这种新一代模型擅长将复杂的文本数据转换为高效的高维数值表示,这对各种现代机器学习任务至关重要。
基本型号信息:
- ► 型号名称: text-embedding-3-large
- ► 开发者: OpenAI
- ► 发布日期: 2024年1月25日
- ► 型号: 文本嵌入
🚀 核心优势和主要特点
text-embedding-3-large 凭借其创新功能脱颖而出,这些功能旨在提供卓越的性能和灵活性:
-
✓ 顶级性能: 该模型提供了 表现最佳 迄今为止的嵌入式系统展现出比其前身显著的改进,并树立了新的行业标杆。
-
✓ 灵活的嵌入尺寸: 开发者通过支持从以下维度嵌入数据,获得了前所未有的控制权: 256 至 3072这种灵活性使得性能要求和资源消耗之间能够实现最佳平衡。
-
✓ 原生支持短链接嵌入: 一项独特的功能,使开发人员能够在不显著损失概念表示的情况下缩短嵌入向量,非常适合优化存储和减少计算开销。
💡 理想的使用场景 text-embedding-3-large
该型号的强大功能使其完美适用于各种高级应用:
- ▷ 高性能搜索: 在庞大的信息库中实现精准、快速的搜索结果。
- ▷ 高级聚类: 便于进行复杂的数据分析和分组,以便更深入地了解复杂的数据集。
- ▷ 强化建议: 强大的推荐引擎,能够提供高度精准且与上下文相关的推荐功能。
- ▷ 稳健的异常检测: 高效识别大型数据流中的异常值和不寻常模式。
- ▷ 详细的多样性测量: 高精度地分析大型文本语料库的广度和多样性。
- ▷ 准确分类: 擅长对复杂的文本数据进行分类,即使在具有挑战性的领域也是如此。
- ▷ 全球多语言支持: 由于增强了对多种语言的支持,它非常适合国际化和多语言应用。
⚙️ 技术架构与培训卓越
详细分析:
-
● 建筑: 建立在尖端技术之上 基于Transformer的架构专为生成具有卓越性能特征的高维嵌入而设计。
-
● 训练数据: 接受过培训 广泛且高度多样化的数据集经过精心策划,旨在捕捉各种语言细微差别、语义和语境复杂性。
-
● 数据来源及规模: 该模型的训练包括 数十亿条文本条目确保对人类语言有全面而深刻的理解。
-
● 多样性与偏见缓解: 我们投入了大量精力来确保训练数据的高度多样性,以便积极地…… 减轻偏见从而增强了模型在不同应用和用户群体中的公平性、稳健性和可靠性。
📈 无与伦比的性能指标
text-embedding-3-large 在关键指标上均表现出显著提升,并达到一流水平:
-
⚡ MIRACL评分: 大幅增长 31.4% (由ada-002实现)令人印象深刻 54.9%突出其卓越的检索能力。
-
⚡ MTEB 评分: 改进自 61.0% (使用 ada-002)到一个稳健的 64.6%证实了其整体嵌入质量的提升。
-
⚡ 准确性: 始终如一地交付成果。 顶级精度 在广泛的多个基准测试中,确保关键任务获得高度可靠的结果。
-
⚡ 速度: 针对以下方面进行了优化 更快的处理速度即使使用更大的维度选项,也能保持效率。
-
⚡ 鲁棒性: 展品 高性能稳定性 能够应对各种不同的输入类型和复杂的上下文场景,确保可靠运行。
❓ 关于 text-embedding-3-large 的常见问题解答 (FAQ)
问题1: text-embedding-3-large 是什么?它何时发布?
A1: text-embedding-3-large 是 OpenAI 最新、最先进的文本嵌入模型,旨在将文本转换为能够捕捉语义的高维数值向量。它已于 [日期缺失] 正式发布。 2024年1月25日。
Q2: 与之前的型号(如ada-002)相比,它的性能提升有多显著?
A2: 它带来了显著的改进,特别是将 MIRACL 得分从 31.4% (ada-002) 提高到 54.9%,将 MTEB 得分从 61.0% (ada-002) 提高到 64.6%。这些指标突显了其卓越的准确性和整体嵌入质量。
Q3: text-embedding-3-large 是否支持自定义嵌入尺寸?
A3: 是的,它具有灵活的嵌入尺寸,允许开发人员从中选择尺寸。 256 至 3072这使得在最佳性能和高效资源利用之间进行微调成为可能。
第四季度: 该模型主要适用于哪些应用场景?
A4: 它非常适合高性能搜索、高级聚类、增强型推荐系统、强大的异常检测、详细的多样性测量和精确的文本分类,尤其适用于需要多语言支持的环境。
Q5: 该模型是否适用于处理多种语言?
A5: 没错。text-embedding-3-large 对多语言的支持有了显著提升,使其成为全球应用和多样化语言数据集的高效解决方案。



登录