qwen-bg
max-ico04
2K
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Incrustación de texto multilingüe 002
Descubra la API Text-multilingual-embedding-002, un modelo poderoso para incrustaciones de texto multilingüe que mejora las aplicaciones de PNL en todos los idiomas.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const { OpenAI } = require('openai');

const main = async () => {
  const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });

  const text = 'Your text string goes here';
  const response = await api.embeddings.create({
    input: text,
    model: 'text-multilingual-embedding-002',
  });
  const embedding = response.data[0].embedding;

  console.log(embedding);
};

main();            
                                
                                        import json
from openai import OpenAI


def main():
    client = OpenAI(
        base_url="https://api.ai.cc/v1",
        api_key="",
    )

    text = "Your text string goes here"

    response = client.embeddings.create(input=text, model="text-multilingual-embedding-002")
    embedding = response.data[0].embedding

    print(json.dumps(embedding, indent=2))


main()   
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Incrustación de texto multilingüe 002

Detalle del producto

Presentamos Text-multilingual-embedding-002

El Incrustación de texto multilingüe 002 El modelo de Google Cloud representa un avance significativo en el procesamiento del lenguaje natural (PLN). Publicado en Marzo de 2023Este modelo de incrustación de texto de última generación está diseñado para transformar datos textuales en representaciones vectoriales numéricas de alta calidad, capturando de manera experta el significado semántico y los matices contextuales en una multitud de idiomas.

Su principal fortaleza reside en su incomparable soporte multilingüe, lo que lo convierte en una herramienta indispensable para aplicaciones globales que requieren una comprensión sofisticada del lenguaje.

⭐ Detalles clave del modelo

  • Nombre del modelo: Incrustación de texto multilingüe 002
  • Revelador: Google Cloud
  • Fecha de lanzamiento: Marzo de 2023
  • Versión: 002
  • Tipo de modelo: Incrustación de texto

🚀 Capacidades principales

  • Soportes más de 100 idiomas, lo que permite un alcance verdaderamente global.
  • Genera incrustaciones semánticas de alta calidad que reflejen con precisión el significado del texto.
  • Optimizado para diversas tareas de PNL, garantizando versatilidad y rendimiento.
  • Ofertas velocidad de inferencia eficiente, crucial para aplicaciones en tiempo real.
  • Demuestra robustez frente a diversas estructuras lingüísticas.

🎯 Aplicaciones previstas

Este potente modelo es ideal para un amplio espectro de aplicaciones multilingües y translingües, entre las que se incluyen:

  • Motores de búsqueda multilingües para una recuperación precisa de información global.
  • Chatbots multilingües que puedan comunicarse eficazmente a través de las barreras del idioma.
  • Análisis de sentimientos comprender la opinión pública en diferentes idiomas.
  • Mejorado servicios de traducción de idiomas con una mejor comprensión contextual.
  • Sofisticado sistemas de recomendación de contenido Adaptado para diversos públicos.

Cabe destacar que Text-multilingual-embedding-002 destaca en aplicaciones multilingües para documentación clínica e investigación. Para obtener más información sobre este y otros modelos de IA en el ámbito sanitario, puede obtener más información. aquí (haciendo referencia a la sección de contenido original sobre “Documentación clínica e investigación” del artículo titulado “IA en la atención médica: usos y ejemplos de IA generativa”).

⚙️ Especificaciones técnicas

Arquitectura

La base del modelo es la gran eficacia Arquitectura del transformadorEste diseño aprovecha mecanismos de autoatención para procesar y generar eficientemente incrustaciones que capturan hábilmente relaciones contextuales intrincadas entre palabras en múltiples idiomas.

Datos de formación y diversidad

Incrustación de texto multilingüe 002 fue entrenado en un conjunto de datos extenso y diverso, que comprende aproximadamente mil millones de frases Recopilado de libros, sitios web y diversas fuentes multilingües, este amplio corpus de formación garantiza una comprensión integral de los matices lingüísticos y facilita una generalización sólida en diferentes idiomas y contextos.

El conocimiento del modelo está actualizado a partir de Marzo de 2023Si bien se hicieron esfuerzos para minimizar el sesgo mediante diversas fuentes de datos, es importante reconocer que, como ocurre con todos los modelos lingüísticos de gran tamaño, es posible que aún se reflejen algunos sesgos inherentes presentes en los datos de entrenamiento.

📊 Puntos de referencia de rendimiento

Punto de referencia de incrustación de texto masivo (MTEB)

El rendimiento en el punto de referencia MTEB subraya la alta precisión del modelo, particularmente en escenarios de recuperación y clasificaciónLas métricas clave incluyen:

  • nDCG@10: 60.8
  • Recordatorio a los 100: 92.4

Estos resultados confirman la eficacia del modelo para clasificar documentos relevantes y recuperar información de conjuntos de datos grandes y complejos de forma eficiente. Además, ha demostrado una robustez excepcional, con un rendimiento consistentemente bueno incluso con contenido generado por el usuario (CGU) diverso en varios idiomas y estructuras.

Análisis comparativo

Text-multilingual-embedding-002 muestra un rendimiento altamente competitivo en comparación con otros modelos líderes de incrustación multilingüe. En las evaluaciones de MTEB, obtuvo un promedio de... Precisión de 64.0 en diversas tareas, destacando su fortaleza en el manejo de consultas multilingües.

El modelo superó notablemente a varios modelos establecidos en su categoría:

  • Text-multilingual-embedding-002: 64.0 (Precisión media)
  • LaBSE (Incrustación de oraciones BERT independiente del lenguaje): 45,2
  • Coherencia: 64.0
  • BGE (Mejor incrustación generativa): 64,2

💡 Uso e integración

Acceso a API y ejemplos de código

El Incrustación de texto multilingüe 002 El modelo está disponible en el Plataforma API de IA/ML, identificable como "texto-multilingüe-incrustado-002"Se proporcionan ejemplos de código prácticos dentro de la plataforma para facilitar una integración rápida.

(Referencia: Plataforma API de IA/ML, sección "Ejemplos de código")

Documentación de la API

Para obtener una guía completa sobre la integración e instrucciones de uso detalladas, consulte la Documentación de la API Disponible en el sitio web de la API de IA/ML.

⚖️ IA ética y licencias

El desarrollo de Text-multilingual-embedding-002 se adhiere a rigurosos prácticas éticas de IA, haciendo hincapié en la transparencia, la equidad y la rendición de cuentas en su diseño y aplicación.

El modelo está disponible en licencias comerciales, permitiendo tanto el uso comercial como no comercial, sujeto a los términos de servicio establecidos por Google Cloud.

Preguntas frecuentes (FAQ)

P1: ¿Qué es Text-multilingual-embedding-002?

A: Es un modelo de incrustación de texto de vanguardia de Google Cloud, lanzado en marzo de 2023, diseñado para convertir texto en representaciones vectoriales numéricas que capturan el significado semántico y el contexto en más de 100 idiomas.

P2: ¿Cuántos idiomas admite?

A: El modelo admite más de 100 idiomas, incluidos los más utilizados, como inglés, español, francés, chino y árabe, lo que lo hace muy versátil para aplicaciones globales.

P3: ¿Cuáles son los principales casos de uso de este modelo?

A: Es ideal para motores de búsqueda multilingües, chatbots multilingües, análisis de sentimientos, servicios de traducción de idiomas y sistemas de recomendación de contenido. También tiene aplicaciones específicas en la documentación e investigación clínica.

P4: ¿Cómo se compara su rendimiento con el de otros modelos?

A: Text-multilingual-embedding-002 demuestra un desempeño competitivo, logrando una precisión promedio de 64,0 en el punto de referencia MTEB, igualando o superando modelos como LaBSE y Cohere en varias tareas.

Q5: ¿Está disponible para uso comercial?

A: Sí, Text-multilingual-embedding-002 está disponible bajo licencia comercial, lo que permite su uso tanto comercial como no comercial, sujeto a los términos de servicio de Google Cloud.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos