qwen-bg
max-ico04
2K
出去
max-ico02
聊天
max-ico03
禁用
文本嵌入-gecko@003
探索 Textembedding-gecko@003 API,这是 Google 开发的一款功能强大的文本嵌入模型,专为各种 NLP 应用和高性能而设计。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'textembedding-gecko@003',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();            
                                
                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="textembedding-gecko@003")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()   
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
文本嵌入-gecko@003

产品详情

Textembedding-gecko@003:Google的高级文本嵌入模型

基本信息

  • 💡 型号名称: 文本嵌入-gecko@003
  • 👤开发者/创建者: Google
  • 📅 发布日期: 2024年4月
  • ✨ 版本: 003
  • 🧠 型号: 文本嵌入

概述: Textembedding-gecko@003 是Google最先进的文本嵌入模型,旨在生成高质量的文本数据向量表示。它擅长捕捉复杂的语义含义和关系,使其成为各种自然语言处理 (NLP) 应用的理想解决方案。

主要特点

  • 🚀 高维性: 输出 768 维的嵌入向量,从而实现丰富的语义表示。
  • ✅ 多功能性: 性能强劲,可与体积更大的型号相媲美,同时保持了令人印象深刻的效率。
  • ⚡ 性能优化: 专为实现卓越的文本嵌入生成精度和速度而设计。

预期用途

该模型主要面向那些需要深入理解上下文文本含义的应用场景。主要应用包括:

  • 语义搜索和信息检索
  • 文本分类与归类
  • 文档聚类和组织

语言支持

Textembedding-gecko@003 主要针对以下用途进行了优化: 英语 处理过程。然而,其适应性使其有可能与其他语言一起使用,具体取决于用于微调的训练数据的具体情况。

技术规格

建筑学

该模型利用了一种复杂的 变压器架构这种设计使其能够高效地处理复杂的语言模式并辨别文本数据中错综复杂的关系,从而构成其高性能能力的支柱。

训练数据

Textembedding-gecko@003 在一个涵盖超过 1000 个数据集的庞大且多样化的数据集上进行了严格训练。 8万亿个Tokens这包括各种各样的来源,例如网络文本、电子书和其他文本语料库,从而确保对众多主题和领域进行强有力的概括。

数据来源和规模

训练数据集融合了结构化文本和非结构化文本,这有助于模型全面理解语言细微差别。如此庞大且多样化的数据集是模型卓越性能的关键因素。

知识门槛

该模型的知识库更新至…… 2024年4月. 此日期之后发生的信息或事件可能无法反映在其理解范围内。

多样性与偏见

在开发过程中,我们投入了大量精力来整合各种数据源,以期减少潜在的偏差。然而,与所有人工智能模型一样,Textembedding-gecko@003 仍然可能无意中反映出其庞大训练数据中固有的一些偏差。

性能基准

由Google开发的 Textembedding-gecko@003 在各种自然语言处理任务中始终表现出色。

大规模文本嵌入基准测试(MTEB)

  • 📊 平均分: 66.31
  • 🏆 主要成就: 尽管自身只有12亿个参数,但它的性能却优于参数量高达70亿的大型模型。这凸显了其卓越的效率和紧凑的设计。

任务特定表现(平均分)

  • 文本分类: 81.17
  • 语义文本相似度: 85.06
  • 总结: 32.63
  • 检索任务: 55.70

零样本泛化

Textembedding-gecko@003 展现出强大的零样本性能,能够有效地泛化到未经显式训练的任务上。这种能力使其在未知的场景中超越了多个已有的竞争性基线模型。

入门指南和使用方法

代码示例和 API 访问

该模型可轻松集成到…… AI/ML API平台 在标识符下 "textembedding-gecko@003"如需直接访问和查看代码示例,请访问该平台: 🔗 AI/ML API平台(注册)

API 文档

综合的 API 文档 AI/ML API 网站提供了详细的指南和示例,可帮助您将其无缝集成到您的应用程序中。 📖 API 文档门户

伦理人工智能与许可

伦理准则

Textembedding-gecko@003 的开发和部署严格遵循人工智能伦理的核心原则。我们的重点是确保 透明度、公平性和问责制 在其整个生命周期和应用过程中。

许可

Textembedding-gecko@003 根据以下条款提供: 许可授予用户广泛的商业和非商业用途权利。

常见问题解答 (FAQ)

什么是 Textembedding-gecko@003?

Textembedding-gecko@003 是Google开发的一种最先进的文本嵌入模型。它可以生成高质量的文本向量表示,捕捉文本的语义含义和关系,适用于各种自然语言处理任务。

它的主要特点是什么?

主要特点包括高维度(768 个嵌入维度)、能够有效地与更大的模型竞争,以及在生成嵌入时兼顾准确性和速度的优化性能。

该模型的知识截止日期是什么时候?

该模型的知识截止日期为2024年4月。这意味着它的理解是基于当时为止可用的数据。

哪里可以找到API文档和代码示例?

详细的 API 文档和代码示例可在以下位置获取: API 文档门户 以及 AI/ML API平台, 分别。

Textembedding-gecko@003 是否适合商业用途?

是的,Textembedding-gecko@003 采用宽松的许可协议,允许商业和非商业用途。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用