qwen-bg
max-ico04
2K
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Incrustación de texto-gecko-multilingüe@001
Explore la API del modelo textembedding-gecko-multilingual@001, su arquitectura, datos de entrenamiento, rendimiento y aplicaciones en tareas de PNL.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'textembedding-gecko-multilingual@001',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();            
                                
                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="textembedding-gecko-multilingual@001")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()   
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Incrustación de texto-gecko-multilingüe@001

Detalle del producto

Modelo textembedding-gecko-multilingual@001 de Google

El incrustación de texto-gecko-multilingüe@001 El modelo, lanzado por Google el 30 de abril de 2024, representa un avance significativo en el procesamiento del lenguaje natural (PLN). Como modelo de incrustación de texto de vanguardia, se especializa en transformar diversos datos textuales en representaciones numéricas vectoriales precisas, capturando eficazmente significados y relaciones semánticas en numerosos idiomas.

✨ Capacidades y características clave

  • Alta capacidad: Admite hasta 3072 tokens de entrada, lo que permite un análisis de texto completo.
  • Salida vectorial: Genera incrustaciones vectoriales detalladas de 768 dimensiones, ideales para una comprensión semántica matizada.
  • Excelencia comparativa: Logra un rendimiento superior en el Massive Text Embedding Benchmark (MTEB), estableciendo nuevos estándares en la industria.
  • Formación innovadora: Aprovecha un novedoso conjunto de datos de ajuste fino (FRet) para mejorar las capacidades de consulta y generación de pasajes.
  • Soporte multilingüe: Diseñado para una amplia cobertura de idiomas, incluidos árabe, bengalí, chino, inglés, francés, hindi y español.

💡 Aplicaciones previstas

Este modelo versátil está diseñado para potenciar una amplia gama de aplicaciones de PNL:

  • 🔍Búsqueda semántica: Mejore la relevancia y la precisión de los resultados de búsqueda al comprender la intención.
  • 🏷️Clasificación de texto: Categorice documentos y fragmentos de texto de forma eficiente.
  • 📚Recuperación de documentos: Mejore el descubrimiento de información relevante en grandes conjuntos de datos.
  • 📊Agrupamiento y recomendación: Agrupe artículos similares y proporcione sugerencias personalizadas.
  • 🚨Detección de valores atípicos: Identificar anomalías o patrones inusuales en datos textuales.

Especificaciones técnicas

Arquitectura

El modelo textembedding-gecko-multilingual@001 utiliza una arquitectura de representación vectorial densa, característica de los modelos de lenguaje grande (LLM) avanzados. Emplea sofisticadas metodologías de aprendizaje profundo para producir incrustaciones que reflejan con precisión el complejo contexto semántico de cualquier texto de entrada.

Datos de formación y diversidad

Entrenado con un conjunto de datos diverso generado mediante un proceso LLM único de dos pasos, el modelo primero genera consultas y pasajes relevantes, y luego los clasifica para crear un conjunto de datos robusto y de ajuste fino. Esto garantiza una amplia cobertura de tareas y un rendimiento mejorado. Si bien la diversidad es un principio de diseño clave para mitigar sesgos, la evaluación continua es vital para abordar cualquier sesgo emergente en los datos de entrenamiento.

Límite de conocimiento

La base de conocimientos del modelo está actualizada a partir de Abril de 2024, reflejando la información más reciente disponible en ese momento.

🚀 Métricas de rendimiento incomparables

El modelo textembedding-gecko-multilingual@001 muestra un rendimiento excepcional, particularmente en el Punto de referencia de incrustación de texto masivo (MTEB)Este completo punto de referencia evalúa modelos en siete categorías y 56 conjuntos de datos.

📊Puntuación media de MTEB: 66.31 con incrustaciones de 768 dimensiones.

Esta puntuación destacada lo posiciona como líder del mercado, superando modelos hasta 7 veces más grandes y aquellos con incrustaciones de mayores dimensiones (hasta 4096 dimensiones), todo ello manteniendo un tamaño compacto de solo 1.200 millones de parámetros.

Excelencia en tareas específicas

El modelo demuestra capacidades superiores en las principales tareas de PNL:

  • 🏷️Clasificación de texto: 81.17
  • ↔️Similitud textual semántica: 85.06
  • 📝Resumen: 32.63
  • 🔎Tareas de recuperación: 55,70

Generalización de disparo cero

Una característica notable es su sólida capacidad de generalización de disparo cero, especialmente cuando se entrena exclusivamente con el conjunto de datos sintéticos FRet. Esto le permite adaptarse eficazmente a tareas desconocidas sin necesidad de exposición previa a conjuntos de datos específicos, superando a menudo diversas líneas de base competitivas.

🛠️ Cómo usar y acceder

Integración y ejemplos de código

El modelo textembedding-gecko-multilingual@001 está disponible en el Plataforma API de IA/MLPuedes integrarlo en tus aplicaciones utilizando la siguiente estructura de código:

Para más detalles, visite el Plataforma API de IA/ML.

Documentación completa de la API

La guía detallada para la integración y el uso está disponible en el sitio web oficial. Documentación de la API proporcionado en el sitio web de la API de IA/ML.

🛡️ Uso ético y licencias

Directrices éticas de IA

El desarrollo y la implementación de textembedding-gecko-multilingual@001 se rigen estrictamente por los principios éticos de la IA. Se recomienda encarecidamente a los desarrolladores que consideren cuidadosamente las implicaciones del uso de modelos de incrustación, especialmente en lo que respecta a la privacidad de los datos, la seguridad y los posibles sesgos algorítmicos en sus aplicaciones.

Información de licencia

El modelo textembedding-gecko-multilingual@001 no es de código abierto. Su uso se rige por acuerdos de licencia específicos establecidos por Google. Los usuarios deben revisar las condiciones de servicio y las políticas de privacidad asociadas para garantizar su cumplimiento.

❓ Preguntas frecuentes (FAQ)

P1: ¿Qué es textembedding-gecko-multilingual@001?

Es un modelo de incrustación de texto de última generación desarrollado por Google, diseñado para convertir texto en representaciones vectoriales numéricas que capturan el significado semántico en múltiples idiomas.

P2: ¿Qué idiomas admite el modelo?

El modelo proporciona soporte multilingüe para una amplia gama de idiomas, incluidos, entre otros, árabe, bengalí, chino, inglés, francés, hindi y español.

P3: ¿Cómo funciona en comparación con otros modelos?

Alcanza una puntuación media de 66,31 en el benchmark MTEB, superando a modelos más grandes y a aquellos con incrustaciones de mayor dimensión, siendo al mismo tiempo más compacto.

P4: ¿Cuáles son los principales casos de uso de este modelo?

Sus usos previstos incluyen búsqueda semántica, clasificación de texto, recuperación de documentos, agrupamiento, sistemas de recomendación y detección de valores atípicos.

P5: ¿Textembedding-gecko-multilingual@001 es un modelo de código abierto?

No, el modelo no es de código abierto. Su uso está sujeto a acuerdos de licencia específicos definidos por Google, y los usuarios deben revisar los términos del servicio.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos