



const { OpenAI } = require('openai');
const main = async () => {
const api = new OpenAI({ apiKey: '', baseURL: 'https://api.ai.cc/v1' });
const text = 'Your text string goes here';
const response = await api.embeddings.create({
input: text,
model: 'textembedding-gecko-multilingual@001',
});
const embedding = response.data[0].embedding;
console.log(embedding);
};
main();
import json
from openai import OpenAI
def main():
client = OpenAI(
base_url="https://api.ai.cc/v1",
api_key="",
)
text = "Your text string goes here"
response = client.embeddings.create(input=text, model="textembedding-gecko-multilingual@001")
embedding = response.data[0].embedding
print(json.dumps(embedding, indent=2))
main()

Detalle del producto
Modelo textembedding-gecko-multilingual@001 de Google
El incrustación de texto-gecko-multilingüe@001 El modelo, lanzado por Google el 30 de abril de 2024, representa un avance significativo en el procesamiento del lenguaje natural (PLN). Como modelo de incrustación de texto de vanguardia, se especializa en transformar diversos datos textuales en representaciones numéricas vectoriales precisas, capturando eficazmente significados y relaciones semánticas en numerosos idiomas.
✨ Capacidades y características clave
- ✅Alta capacidad: Admite hasta 3072 tokens de entrada, lo que permite un análisis de texto completo.
- ✅Salida vectorial: Genera incrustaciones vectoriales detalladas de 768 dimensiones, ideales para una comprensión semántica matizada.
- ✅Excelencia comparativa: Logra un rendimiento superior en el Massive Text Embedding Benchmark (MTEB), estableciendo nuevos estándares en la industria.
- ✅Formación innovadora: Aprovecha un novedoso conjunto de datos de ajuste fino (FRet) para mejorar las capacidades de consulta y generación de pasajes.
- ✅Soporte multilingüe: Diseñado para una amplia cobertura de idiomas, incluidos árabe, bengalí, chino, inglés, francés, hindi y español.
💡 Aplicaciones previstas
Este modelo versátil está diseñado para potenciar una amplia gama de aplicaciones de PNL:
- 🔍Búsqueda semántica: Mejore la relevancia y la precisión de los resultados de búsqueda al comprender la intención.
- 🏷️Clasificación de texto: Categorice documentos y fragmentos de texto de forma eficiente.
- 📚Recuperación de documentos: Mejore el descubrimiento de información relevante en grandes conjuntos de datos.
- 📊Agrupamiento y recomendación: Agrupe artículos similares y proporcione sugerencias personalizadas.
- 🚨Detección de valores atípicos: Identificar anomalías o patrones inusuales en datos textuales.
Especificaciones técnicas
Arquitectura
El modelo textembedding-gecko-multilingual@001 utiliza una arquitectura de representación vectorial densa, característica de los modelos de lenguaje grande (LLM) avanzados. Emplea sofisticadas metodologías de aprendizaje profundo para producir incrustaciones que reflejan con precisión el complejo contexto semántico de cualquier texto de entrada.
Datos de formación y diversidad
Entrenado con un conjunto de datos diverso generado mediante un proceso LLM único de dos pasos, el modelo primero genera consultas y pasajes relevantes, y luego los clasifica para crear un conjunto de datos robusto y de ajuste fino. Esto garantiza una amplia cobertura de tareas y un rendimiento mejorado. Si bien la diversidad es un principio de diseño clave para mitigar sesgos, la evaluación continua es vital para abordar cualquier sesgo emergente en los datos de entrenamiento.
Límite de conocimiento
La base de conocimientos del modelo está actualizada a partir de Abril de 2024, reflejando la información más reciente disponible en ese momento.
🚀 Métricas de rendimiento incomparables
El modelo textembedding-gecko-multilingual@001 muestra un rendimiento excepcional, particularmente en el Punto de referencia de incrustación de texto masivo (MTEB)Este completo punto de referencia evalúa modelos en siete categorías y 56 conjuntos de datos.
📊Puntuación media de MTEB: 66.31 con incrustaciones de 768 dimensiones.
Esta puntuación destacada lo posiciona como líder del mercado, superando modelos hasta 7 veces más grandes y aquellos con incrustaciones de mayores dimensiones (hasta 4096 dimensiones), todo ello manteniendo un tamaño compacto de solo 1.200 millones de parámetros.
Excelencia en tareas específicas
El modelo demuestra capacidades superiores en las principales tareas de PNL:
- 🏷️Clasificación de texto: 81.17
- ↔️Similitud textual semántica: 85.06
- 📝Resumen: 32.63
- 🔎Tareas de recuperación: 55,70
Generalización de disparo cero
Una característica notable es su sólida capacidad de generalización de disparo cero, especialmente cuando se entrena exclusivamente con el conjunto de datos sintéticos FRet. Esto le permite adaptarse eficazmente a tareas desconocidas sin necesidad de exposición previa a conjuntos de datos específicos, superando a menudo diversas líneas de base competitivas.
🛠️ Cómo usar y acceder
Integración y ejemplos de código
El modelo textembedding-gecko-multilingual@001 está disponible en el Plataforma API de IA/MLPuedes integrarlo en tus aplicaciones utilizando la siguiente estructura de código:
Para más detalles, visite el Plataforma API de IA/ML.
Documentación completa de la API
La guía detallada para la integración y el uso está disponible en el sitio web oficial. Documentación de la API proporcionado en el sitio web de la API de IA/ML.
🛡️ Uso ético y licencias
Directrices éticas de IA
El desarrollo y la implementación de textembedding-gecko-multilingual@001 se rigen estrictamente por los principios éticos de la IA. Se recomienda encarecidamente a los desarrolladores que consideren cuidadosamente las implicaciones del uso de modelos de incrustación, especialmente en lo que respecta a la privacidad de los datos, la seguridad y los posibles sesgos algorítmicos en sus aplicaciones.
Información de licencia
El modelo textembedding-gecko-multilingual@001 no es de código abierto. Su uso se rige por acuerdos de licencia específicos establecidos por Google. Los usuarios deben revisar las condiciones de servicio y las políticas de privacidad asociadas para garantizar su cumplimiento.
❓ Preguntas frecuentes (FAQ)
P1: ¿Qué es textembedding-gecko-multilingual@001?
Es un modelo de incrustación de texto de última generación desarrollado por Google, diseñado para convertir texto en representaciones vectoriales numéricas que capturan el significado semántico en múltiples idiomas.
P2: ¿Qué idiomas admite el modelo?
El modelo proporciona soporte multilingüe para una amplia gama de idiomas, incluidos, entre otros, árabe, bengalí, chino, inglés, francés, hindi y español.
P3: ¿Cómo funciona en comparación con otros modelos?
Alcanza una puntuación media de 66,31 en el benchmark MTEB, superando a modelos más grandes y a aquellos con incrustaciones de mayor dimensión, siendo al mismo tiempo más compacto.
P4: ¿Cuáles son los principales casos de uso de este modelo?
Sus usos previstos incluyen búsqueda semántica, clasificación de texto, recuperación de documentos, agrupamiento, sistemas de recomendación y detección de valores atípicos.
P5: ¿Textembedding-gecko-multilingual@001 es un modelo de código abierto?
No, el modelo no es de código abierto. Su uso está sujeto a acuerdos de licencia específicos definidos por Google, y los usuarios deben revisar los términos del servicio.
Patio de juegos de IA



Acceso